洞察開源風(fēng)云,,熱議實(shí)時(shí)話題,趣解生活點(diǎn)滴,,自媒體探索者,,與你同行。 Hello,,大家好,,我是源動(dòng)思潮,不定期給大家分享一些開源項(xiàng)目,、實(shí)時(shí)熱點(diǎn)話題討論,。 在這個(gè)信息爆炸的時(shí)代,,大型語言模型(LLM)正在成為我們獲取、處理和理解信息的重要工具。然而,,直接將網(wǎng)頁內(nèi)容輸入到LLM中存在諸多挑戰(zhàn),如網(wǎng)頁結(jié)構(gòu)復(fù)雜,、加載緩慢等問題,。 今天開源君給大家介紹一個(gè)非常酷的開源項(xiàng)目 - Reader,,可以極大改善大型語言模型(LLM)的輸入質(zhì)量,。 簡(jiǎn)介Reader是一個(gè) Jina AI 開發(fā)的專為L(zhǎng)LM設(shè)計(jì)的創(chuàng)新工具,,它可以將網(wǎng)頁信息轉(zhuǎn)換為L(zhǎng)LM友好的格式,,如Markdown。通過去除網(wǎng)頁中的冗余HTML標(biāo)簽和代碼,,Reader保留了核心文本內(nèi)容,,使得LLM能夠更容易地解析和理解網(wǎng)頁信息。 主要功能有兩個(gè):讀取和搜索,。
此外,,Reader還支持流模式,能夠處理加載緩慢的網(wǎng)頁,,并逐步獲取內(nèi)容,。 目前在Github上面收獲了4.6K star,! 性能特色
安裝使用本地開發(fā)的話,,需要先安裝 Node v18 和 Firebase CLI,,然后依次執(zhí)行命令 git clone [email protected]:jina-ai/reader.git
cd backend/functions
npm install
快速使用最簡(jiǎn)單的使用方法是,直接訪問 Jina AI 提供的在線演示頁面:https:///reader#demo,,可以立即體驗(yàn) Reader 的功能而無需進(jìn)行任何安裝,。 讀取 搜索 通過轉(zhuǎn)換之后,,AI回答和識(shí)別的速度,準(zhǔn)度都大大提高,。 也可以直接使用添加前綴的方法快速使用,。 比如,使用讀取模式,,在瀏覽器地址欄中輸入 https://r./,,后面跟上想要轉(zhuǎn)換的網(wǎng)頁 URL。例如,,要轉(zhuǎn)換 Wikipedia 上關(guān)于人工智能的頁面,,可以訪問:https://r./https://en./wiki/Artificial_intelligence 這樣可以讓 LLM 更好的提取信息 使用搜索模式,,在瀏覽器地址欄中輸入 https://s./,后面跟上搜索查詢,。例如,,搜索 '2024 US presidential election',可以訪問:https://s./Who%20will%20win%202024%20US%20presidential%20election%3F 使用 Reader API 基本用法 高級(jí)用法 如果想體驗(yàn) Reader 的流式模式,,可以在命令行中使用 curl 命令,。
JSON 模式體驗(yàn),使用 curl 命令設(shè)置 Accept 頭為 application/json: curl -H 'Accept: application/json' https://r./https://en.m./wiki/Main_Page
小結(jié)一下,,Reader是 Jina AI 開發(fā)的一個(gè)功能強(qiáng)大且易于使用的工具,,它通過簡(jiǎn)化網(wǎng)頁內(nèi)容的獲取和轉(zhuǎn)換過程,極大地提升了 LLM 應(yīng)用的效率和準(zhǔn)確性。 更多細(xì)節(jié)功能,,感興趣的可以到項(xiàng)目地址查看: 項(xiàng)目地址: 關(guān)注我們,,一起探索有意思的開源項(xiàng)目。 |
|