LangChain首席執(zhí)行官Harrison Chase提出了“環(huán)境智能體”(Ambient Agents)這一新興概念,并將其與傳統(tǒng)聊天智能體進(jìn)行了區(qū)分。
與需要用戶主動(dòng)發(fā)起交互的聊天機(jī)器人不同,“環(huán)境智能體”并非由用戶直接發(fā)起交互,而是被動(dòng)地監(jiān)聽事件流(如新郵件、日歷提醒、系統(tǒng)通知等),并在后臺(tái)自主運(yùn)行,支持多任務(wù)并行且對(duì)交互延遲的要求更低。這種特性使其能夠擴(kuò)展個(gè)人能力、處理更復(fù)雜的操作。
Chase強(qiáng)調(diào),“環(huán)境”并非等同于“完全自主”,人機(jī)交互對(duì)環(huán)境智能體至關(guān)重要,具體體現(xiàn)在:用戶審批或拒絕智能體的行動(dòng)建議、編輯智能體的操作、在智能體遇到障礙時(shí)為其解答疑問,以及“時(shí)間旅行”功能(即回顧并修正智能體歷史步驟中的決策)。這不僅能帶來更好的結(jié)果、建立信任,更有助于智能體通過學(xué)習(xí)用戶互動(dòng)來優(yōu)化其“記憶”和未來表現(xiàn)。
環(huán)境智能體:未來已來
我們致力于構(gòu)建開發(fā)者工具,旨在讓構(gòu)建智能體變得盡可能簡單。迄今為止,我們看到構(gòu)建的大多數(shù)智能體,我稱之為“聊天智能體”—你通過聊天界面與它們互動(dòng),發(fā)送消息,它們執(zhí)行任務(wù)并作出回應(yīng)。它們?cè)诤芏喾矫娑急憩F(xiàn)出色,但令我個(gè)人非常興奮的一個(gè)概念是“環(huán)境智能體”。
什么是環(huán)境智能體?
什么是環(huán)境智能體?我傾向于這樣定義:環(huán)境智能體能夠監(jiān)聽一個(gè)事件流,并據(jù)此采取相應(yīng)行動(dòng),甚至可能同時(shí)處理多個(gè)事件。
這與普通的智能體有何不同?
首先,觸發(fā)機(jī)制的差異。環(huán)境智能體的啟動(dòng)不再依賴于人類用戶輸入消息,而是由后臺(tái)發(fā)生的某個(gè)事件觸發(fā)。
其次,并行處理能力,即可同時(shí)運(yùn)行的數(shù)量。對(duì)于聊天智能體,通常一次只能與一個(gè)智能體互動(dòng),或許你可以打開幾個(gè)窗口,同時(shí)運(yùn)行幾個(gè),但基本是一對(duì)一的;而對(duì)于環(huán)境智能體,它們監(jiān)聽的是事件,因此其運(yùn)行數(shù)量取決于后臺(tái)發(fā)生的事件數(shù)量,這個(gè)數(shù)字可能會(huì)大得多。
然后,延遲要求的不同。使用聊天智能體時(shí),你發(fā)送消息后期望能迅速得到回應(yīng),否則你可能會(huì)感到厭煩而去瀏覽其他網(wǎng)站;但環(huán)境智能體在后臺(tái)運(yùn)行,由事件觸發(fā),因此它們可以在需要任何形式的響應(yīng)之前,運(yùn)行更長的時(shí)間,它們通常對(duì)延遲的要求要寬松得多。
最后,用戶體驗(yàn)的重塑。對(duì)于聊天智能體,我們現(xiàn)在已經(jīng)非常熟悉聊天機(jī)器人界面;但對(duì)于在后臺(tái)運(yùn)行的智能體,我們?nèi)绾闻c之互動(dòng)這似乎還是一個(gè)有待探索的問題。因?yàn)樗鼈冊(cè)谀悴恢榈那闆r下運(yùn)行,你與它們進(jìn)行某種形式的互動(dòng)至關(guān)重要。
舉個(gè)例子:一個(gè)電子郵件智能體就是一個(gè)環(huán)境智能體,它可以監(jiān)聽收到的郵件并據(jù)此采取行動(dòng),比如嘗試回復(fù)郵件、安排會(huì)議,或提醒你和團(tuán)隊(duì)中的其他人。這可以算作一種環(huán)境智能體的具體實(shí)例。
為何選擇環(huán)境智能體?
我認(rèn)為環(huán)境智能體引發(fā)關(guān)注的原因有幾點(diǎn):
1.規(guī)?;嵘齻€(gè)人能力。當(dāng)你與聊天智能體互動(dòng)時(shí),通常是一對(duì)一的,一次只做一件事。而擁有了環(huán)境智能體,成千上萬個(gè)智能體可在后臺(tái)同時(shí)運(yùn)行,這將極大地?cái)U(kuò)展我們的影響力。
2.處理更復(fù)雜的操作。與聊天智能體互動(dòng)時(shí),由于延遲要求,它執(zhí)行的通常是較為簡單的操作。但環(huán)境智能體不存在如此嚴(yán)格的延遲限制,因此可以調(diào)用大量工具,執(zhí)行越來越復(fù)雜的操作。你還可以加入其他步驟,比如明確的規(guī)劃或反思環(huán)節(jié),從而逐步提升所構(gòu)建智能體的復(fù)雜性。
環(huán)境并非意味著完全自主:人機(jī)協(xié)同的重要性
“環(huán)境”并不等同于“完全自主”,我仍然認(rèn)為,我們能夠與這些環(huán)境智能體進(jìn)行互動(dòng)至關(guān)重要。人們正在構(gòu)建幾種不同的人機(jī)交互模式:
1.審批與拒絕。即審批或拒絕這些智能體想要執(zhí)行的某些操作,例如如果你想讓一個(gè)環(huán)境智能體處理給投訴客戶退款的郵件,那么在初期階段,你肯定希望有人工介入來審批這些退款操作。
2.編輯與修正。即編輯智能體將要執(zhí)行的操作,也許智能體提出了一個(gè)建議,你不想簡單地批準(zhǔn)或拒絕,而是希望明確地修改它,然后讓它執(zhí)行修改后的操作。
3.解疑與指導(dǎo)。這些智能體有時(shí)可能會(huì)在任務(wù)中途卡住,因此應(yīng)該有一種機(jī)制,讓你能夠回答它們可能提出的問題,就像你會(huì)回答正在處理復(fù)雜問題的同事提出的問題一樣。
4.時(shí)間旅行:回溯與干預(yù)。由于這些智能體需要執(zhí)行許多步驟,你可能會(huì)發(fā)現(xiàn)回溯到比如總共100個(gè)步驟中的第10步,在那里進(jìn)行互動(dòng),修改它的行為,給予一些反饋將非常有用。
我們稱之為“時(shí)間旅行”,促進(jìn)這種交互是我們看到的一種很酷的新模式。
讓人類參與其中之所以重要,有以下幾個(gè)原因:
首先,提升成果質(zhì)量。以深度研究(Deep Research)為例,雖然它不完全是環(huán)境智能體,但它是一個(gè)長期運(yùn)行的智能體。在初期階段,它會(huì)問你一些澄清性問題,來回溝通,這通常比它僅根據(jù)你最初的問題或陳述就自行運(yùn)作能產(chǎn)生更好的結(jié)果。因此,在深度研究中通過提問澄清問題,在環(huán)境智能體中通過不同類型的交互模式讓人類參與進(jìn)來,都能提升最終成果的質(zhì)量。
其次,構(gòu)建信任感。如果你要執(zhí)行明確的行動(dòng),比如付款或批準(zhǔn)某些事項(xiàng),有人工參與會(huì)讓人更加放心。
最后,優(yōu)化智能體記憶與學(xué)習(xí)。這一點(diǎn)可能最為微妙,我認(rèn)為它對(duì)智能體的“記憶”有很大幫助。我所說的記憶,是指從用戶互動(dòng)中學(xué)習(xí)。如果你不與智能體互動(dòng),那么它就沒有用戶互動(dòng)可供學(xué)習(xí)。因此,讓人類參與其中,有助于為你想植入智能體的許多記憶功能提供信息,使其將來能表現(xiàn)得更好。
評(píng)論
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最愛