AI 報給你知

1400 萬次搜尋背後的真相：AI 搜尋代理人比你想像中更「專情」？

1. 前言：當搜尋不再只是輸入關鍵字

在過去的二十年裡，我們對「搜尋」的定義極其單一：在空白欄位輸入幾個破碎的關鍵字，然後在演算法吐出的藍色連結大海中，像個苦力般自行打撈答案。但隨著大型語言模型（LLM）跨入「代理人時代（Agentic Era）」，這場遊戲的本質正發生劇變。AI 搜尋代理人不再只是被動的工具，它們正進化為具備拆解問題、多輪檢索、並能自我修正路徑的數位探險家。然而，當我們將複雜的研究任務委託給這些 AI 時，它們究竟是在深思熟慮地挖掘真相，還是在演算法的迷宮中原地打轉？為了執行這場針對 AI 行為的「數位解剖」，來自卡內基美隆大學（CMU）等機構的研究團隊，深入分析了 DeepResearchGym 平台中高達 1,444 萬次搜尋請求與 397 萬個完整對話會話（Sessions）。這份沉甸甸的數據日誌，為我們揭開了 AI 搜尋行為背後的「人性」與「偏執」。

2. 效率驚人：十步之內，見微知著

數據顯示，AI 搜尋代理人的運作邏輯展現出一種令人戰慄的機械式效率。它們追求的是極致的精確與推進節奏，而非如人類般在網頁間漫無目的地遊蕩。核心數據：

超過 90% 的多輪搜尋對話在 10 個步驟內即告完成。
高達 89% 的步驟間隔少於一分鐘。這種「快準狠」的行為模式，折射出 AI 代理人在處理資訊時的強大張力，但也勾勒出了目前的複雜度邊界。這暗示目前的 AI 代理人雖然擅長「淺層深度（Shallow-deep）」的任務處理，但對於真正棘手、需要跨越數小時乃至數日思考的「邪惡問題（Wicked Problems）」，我們似乎正撞上一道無形的牆。它們目前更像是一支訓練有素的特種部隊，而非漫步在知識長河裡的哲學家。

3. 搜尋人格：強迫症實錄 vs. 數位偵探

研究進一步發現，AI 代理人並非千篇一律的機器。根據任務「意圖（Intent）」的不同，它們會分裂出截然不同的行為人格：

事實尋求型（Fact-seeking）：
行為特徵：表現出高度的重複性，且隨著對話推進，重複行為會顯著增加。
分析：這像是一位極度焦慮的**「考據狂」**。為了確保某個數據或事實的絕對準確，AI 會反覆回頭查證。這種重複並非當機，而是一種為了追求「落地（Grounding）」與驗證的行為代價。
推理型（Reasoning）：
行為特徵：展現出更廣泛、更具發散性的探索軌跡。
分析：這則像是一位**「資深調查記者」**。在試圖拼湊複雜邏輯時，它懂得不斷變換切入點，跳脫原有的資訊框架去尋找缺失的拼圖塊。幽默地看，AI 在找死資料時比誰都死板，像個陷入迴圈的強迫症患者；但在面對邏輯難題時，卻能展現出令人驚訝的靈活性。

4. 關鍵數據：54% 的「專情」哲學

這份研究最具洞見的發現，莫過於提出了**「脈絡驅動術語採用率（Context-driven Term Adoption Rate, CTAR）」。這項指標衡量的是：AI 在進行下一輪搜尋時，有多少新詞彙是源自於之前已經挖掘到的證據？「平均有 54% 的新查詢詞彙源自於已累積的證據脈絡。這顯示 AI 代理人正積極地『反芻』既有資訊，以最忠誠的姿態優化搜尋路徑。」這種 54% 的「回頭草」哲學，完美詮釋了 AI 的「專情」特質**。它不輕易被網路上無窮無盡的「雜訊」給誘拐，而是對已經掌握的證據保持極高的忠誠度。它像是一名數位偵探，從第一步找到的蛛絲馬跡中提煉出關鍵詞，隨即將其應用在後續的追蹤裡。更關鍵的是，這種「專情」是具備跨時空記憶的——新詞彙不只來自上一秒的結果，而是跨越整個搜尋軌跡的知識累積。

5. 未來的進化：懂得「收手」的智慧

基於對這 1,400 萬次數位足跡的解讀，研究團隊為未來的 AI 搜尋指明了兩大進化方向，試圖解決 AI 代理人「過度偏執」的問題：

重複感知（Repetition-aware）的自動停止機制：當系統察覺事實尋求任務進入了無效的重複循環時，AI 應具備「自省」能力，主動停止無謂的運算浪費。
意圖自適應（Intent-adaptive）的預算分配：未來的 AI 應該學會根據任務難度自動分配能量。面對簡單事實，快刀斬亂麻；面對深度推理，則放寬預算，容許更多的發散性探索。這意味著未來的 AI 將不再只是盲目搜尋的工具，而是一個懂得何時該堅持、何時該放棄的智慧實體。

6. 結語：我們正在見證搜尋的第二次革命

這份來自 DeepResearchGym 的重磅分析，首度將 AI 搜尋代理人的運作黑盒子透明化。我們看見了 AI 如何透過極速的脈絡反芻，將碎片化的資訊重構成為具備邏輯的一致性知識。搜尋的本質正從「獲取連結」演變為「建構理解」。當 AI 已經學會從過去的線索中編織未來，展現出比人類更精準、更「專情」的邏輯一致性時，這對人類提出了新的挑戰。如果 AI 搜尋已經學會了如何從證據中精準提問，那麼身為人類的我們，在「定義問題」與「想像答案」這件事上，是否應該變得更加大膽且不拘一格？

搜尋此網誌