產生資訊檢索如何重塑搜尋
生成式人工智慧正在改變搜尋。再見藍色鏈接,你好 AI 答案。了解這種轉變對 SEO 和流量的未來意味著什麼。 搜尋已死,搜尋萬歲! 搜尋已不再像以前那樣。 搜尋引擎不再簡單地將使用者查詢中的關鍵字或短語與網頁進行比對。我們正在遠遠超越詞彙搜尋的世界,詞彙搜尋只是基於文本,不理解事物之間的語義聯繫,也不理解事物/概念的多媒體表示之間的語義聯繫。 如今,人工智慧可以充分利用機率預測和模式匹配來理解、闡釋並產生訊息,以響應用戶意圖。 這項轉變是由產生資訊檢索所推動的。 產生資訊檢索是系統顯示和呈現資訊方式的根本轉變。 Google DeepMind 的傑出科學家 Marc Najork 在 SIGIR 2023 的主題演講中闡述了大型語言模型 (LLM) 如何改變搜尋和資訊檢索,值得重新回顧。他的演講也探討了我們如何隨著時間的推移,透過從詞彙到語義、混合和生成方法的迭代變化來達到這一目標。 從檢索到生成 幾十年來,搜尋引擎一直透過指向可能包含答案的文件來回應用戶查詢。 但該模式正在不斷發展。我們現在正處於生成資訊檢索的早期階段。 該系統不僅僅是尋找內容;它根據以多模式方式檢索到的內容產生答案,將未指定的查詢可能代表的所有內容整合在一起,並在一個視圖中進行綜合。 Najork 將這種轉變描述為從傳統的基於檢索的系統(傳回文件的排序清單)轉向檢索增強生成 (RAG) 系統。 在 RAG 設定中,模型從語料庫中檢索相關文檔,然後使用它們作為基礎知識和上下文來產生直接的自然語言回應。 簡而言之,搜尋者不會看到網頁連結清單。他們得到的是綜合的、直接的答案,通常是帶有樂於助人的助手的語氣和風格。 這種新方法由經過大量資料訓練的 LLM 提供支持,並且可以對檢索到的內容進行推理。 這些系統並不完善。我們知道他們產生了幻覺並誤解了事實。 我們可以親眼看到,搜尋引擎和其他科技公司利用人工智慧和大型語言模型來總結新聞標題和摘要等多種方式,正在努力控制法學碩士和生成式人工智慧的幻覺性質。 問題? 生成式人工智慧建立在機率模式而非事實之上。 谷歌正在研究新聞標題和摘要產生錯誤的基本原因,並開發了一個名為ExHalder的評估框架。另一個例子是彭博社(需要訂閱),僅在過去一周左右它就不得不 […] …