作者:lexie
編輯:Lu

在關(guān)于 AI 的大討論中,人們?yōu)槠滟x予的角色要么是我們最得力的高效助手,要么則是將顛覆我們的「機(jī)器軍團(tuán)」,不管是敵是友, AI 不僅要能完成人類布置的任務(wù),還要能「讀懂」人心,而這一讀心能力也正是今年以來 AI 領(lǐng)域的重頭戲。
在 PitchBook 今年發(fā)布的企業(yè) Saas 新興技術(shù)研究報(bào)告中,「情感 AI」成為了一大技術(shù)亮點(diǎn),它指的是使用情感計(jì)算和人工智能技術(shù)來感知、了解和進(jìn)行對(duì)人類情感的互動(dòng),試圖通過分析文字、面部表情、聲音和其他生理信號(hào)來理解人類的情緒,簡(jiǎn)單來說,情感 AI 就是希望機(jī)器能像人類一樣,甚至比人類更好地「讀懂」情感。
它的主要技術(shù)包括:
面部表情分析:通過攝像頭、計(jì)算機(jī)視覺和深度學(xué)習(xí),檢測(cè)微表情與面部肌肉運(yùn)動(dòng)。
聲音分析:通過聲紋、語調(diào)、節(jié)奏識(shí)別情緒狀態(tài)。
文本分析:借助自然語言處理(NLP)技術(shù)解讀語句和上下文。
生理信號(hào)監(jiān)測(cè):使用可穿戴設(shè)備分析心率、皮膚反應(yīng)等,提升互動(dòng)個(gè)性化和情感豐富度。

Emotion AI
情感 AI 的前身是情感分析技術(shù),它主要是通過文本互動(dòng)進(jìn)行分析,比如在社交媒體上通過文字進(jìn)行用戶情感的分析和提取,而有了 AI 的加持,整合視覺和音頻等多種輸入方式,情感 AI 承諾著更加精準(zhǔn)和完整的情感分析。
01 VC 撒錢,創(chuàng)企獲巨額融資
硅兔君觀察,情感 AI 的潛力吸引了眾多投資者的關(guān)注,一些專注于這個(gè)領(lǐng)域的初創(chuàng)公司像 Uniphore、MorphCast 等,已經(jīng)在這一賽道上獲得了大量投資。
來自加州的Uniphore從 2008 年起就在探索為企業(yè)提供自動(dòng)化對(duì)話解決方案,已經(jīng)開發(fā)出包括 U-Self Serve、U-Assist、U-Capture 和 U-Analyze 等多個(gè)產(chǎn)品線,幫助客戶通過語音、文本、視覺和情感 AI 技術(shù)進(jìn)行更加個(gè)性化和情感豐富的互動(dòng)。U-Self Serve 主打精準(zhǔn)識(shí)別對(duì)話中的情感和語氣,讓企業(yè)能夠提供更加個(gè)性化的服務(wù),來提升用戶參與滿意度;

U-Self Serve
U-Assist 則能通過實(shí)時(shí)指導(dǎo)和工作流程的自動(dòng)化來提高客服代理的工作效率;U-Capture 可以通過自動(dòng)化的情感數(shù)據(jù)收集和分析,讓企業(yè)擁有對(duì)客戶需求和滿意度的深度洞察;而 U-Analyze 則能夠幫助客戶識(shí)別互動(dòng)中的關(guān)鍵趨勢(shì)和情感變化,提供由數(shù)據(jù)驅(qū)動(dòng)的決策支持來增強(qiáng)品牌忠誠(chéng)度。
Uniphore 的技術(shù)并不僅僅是讓機(jī)器理解語言,而是希望它們能在與人類互動(dòng)時(shí),捕捉和解讀隱藏在語氣、表情背后的情感。這種能力讓企業(yè)在與客戶互動(dòng)時(shí),不再只是機(jī)械化應(yīng)對(duì),而是能夠更好地滿足客戶的情感需求,通過使用 Uniphore, 企業(yè)的用戶滿意度能夠達(dá)到 87%,客服表現(xiàn)提升 30%。
Uniphore 至今已經(jīng)完成了超 6.2 億美元融資,最近一輪投資來自于 2022 年由 NEA 領(lǐng)投的 4 億美元,March Capital 等現(xiàn)有的投資者也進(jìn)行了參投,此輪后估值達(dá)到了 25 億美元。

Uniphore
Hume AI則推出了世界上第一個(gè)能夠共情的語音 AI,由前 Google 科學(xué)家 Alan Cowen 創(chuàng)立,他曾以開創(chuàng)了語義空間理論而出名,這一理論通過揭示聲音、面部和手勢(shì)的細(xì)微差別,來理解情緒體驗(yàn)和表達(dá),Cowen 的研究成果發(fā)表在「自然」和「認(rèn)知科學(xué)趨勢(shì)」等眾多期刊上,涉及迄今為止研究范圍最廣、最多樣化的情緒樣本。
以此研究驅(qū)動(dòng)的 Hume 開發(fā)出了對(duì)話式語音 API - EVI,它結(jié)合了大型語言模型和同理心算法,能夠深入理解和解析人類的情感狀態(tài),它不但能識(shí)別語音中的情感,還能在與用戶的互動(dòng)中做出更加細(xì)膩和個(gè)性化的反應(yīng),而開發(fā)人員只需幾行代碼即可使用這些功能,并可將其內(nèi)置到任何應(yīng)用程序中。

Hume AI
當(dāng)前大多數(shù) AI 系統(tǒng)的主要限制之一在于它的指令主要由人類給出,這些指令和提示容易出錯(cuò)且無法挖掘出人工智能的巨大潛力,而 Hume 所開發(fā)出的共情大型語言模型 (eLLM) 能夠根據(jù)上下文和用戶的情緒表達(dá)調(diào)整其使用的詞語和語調(diào),通過將人類快樂作為第一原則進(jìn)行機(jī)器的學(xué)習(xí)、調(diào)整和互動(dòng),在心理健康、教育培訓(xùn)、急救呼叫、品牌分析等多個(gè)場(chǎng)景中都能為用戶帶來更加自然和真實(shí)的體驗(yàn)。
就在今年 3 月,Hume AI 完成了由 EQT Ventures 領(lǐng)投的 5000 萬美元 B 輪融資,投資方還包括 Union Square Ventures、Nat Friedman & Daniel Gross、Metaplanet 和 Northwell Holdings 等機(jī)構(gòu)。
在這一領(lǐng)域的還有專門衡量消費(fèi)者認(rèn)知和情感反應(yīng)的Entropik,通過 Decode 這一融合了情感 AI、行為 AI、生成 AI 和預(yù)測(cè) AI 綜合力量的功能,它能夠更好了解消費(fèi)者的行為和偏好,從而提供更個(gè)性化的營(yíng)銷建議,Entropik 最近在 2023 年 2 月完成了 2500 萬美元的 B 輪融資,投資方包括 SIG Venture Capital 和 Bessemer Venture Partners。

Entropik
02 巨頭參與,一片混戰(zhàn)
科技大廠憑借自身優(yōu)勢(shì),在情感 AI 這一領(lǐng)域也有所布局。
包括Microsoft Azure認(rèn)知服務(wù)的情感 API,能夠通過分析面部表情和情緒,來識(shí)別圖片和視頻中的喜悅、憤怒、悲傷、驚訝等多種情緒;
IBM Watson的自然語言理解 API 可以處理大量文本數(shù)據(jù),識(shí)別出背后的情感傾向(如積極、消極或中性),來更精準(zhǔn)的解讀用戶意圖;
Google Cloud AI的 Cloud Vision API 擁有強(qiáng)大的圖像分析功能,能夠快速識(shí)別圖片中的情緒表達(dá),且支持文字識(shí)別和情緒關(guān)聯(lián);
AWS 的 Rekognition也能夠檢測(cè)情緒、識(shí)別面部特征并追蹤表情變化,還可以與其他 AWS 服務(wù)結(jié)合使用,成為完整的社媒分析或情感 AI 驅(qū)動(dòng)的營(yíng)銷應(yīng)用。

Cloud Vision API
有些初創(chuàng)公司在情感 AI 領(lǐng)域的研發(fā)腳步更快,甚至到了科技巨頭都要「挖人」的地步,比如獨(dú)角獸Inflection AI就被投資方微軟看中了 AI 團(tuán)隊(duì)和模型,微軟在與 Bill Gates、Eric Schmidt 和 NVIDIA 等多方共同為 Inflection AI 投下了 13 億美元后,向 AI 領(lǐng)軍人物也是 Inflection AI 的聯(lián)合創(chuàng)立者之一 Mustafa Suleyman 拋出橄欖枝,隨后 Suleyman 連帶 70 多位員工轉(zhuǎn)投微軟,而微軟也為此支付了近 6.5 億美元。
不過,Inflection AI 也很快重整旗鼓,組建了來自擁有谷歌翻譯、 AI 咨詢和 AR 多個(gè)背景的新團(tuán)隊(duì),繼續(xù)在其核心產(chǎn)品 Pi 上持續(xù)發(fā)力。Pi 是一款能夠理解并回應(yīng)用戶情感的個(gè)人助手,與傳統(tǒng)的 AI 不同,Pi 更加注重與用戶建立情感連接,通過分析語音、文字等輸入感知情緒,在對(duì)話中展現(xiàn)出同理心。Inflection AI 將 Pi 視為教練、知己、傾聽者和創(chuàng)意伙伴,而不是簡(jiǎn)單的 AI 助手。此外,Pi 擁有強(qiáng)大的記憶功能,能夠記住用戶的多次對(duì)話歷史,以此來提升互動(dòng)的連續(xù)性和個(gè)性化體驗(yàn)。

Inflection AI Pi
03 發(fā)展之路,關(guān)注和質(zhì)疑并存
雖然情感 AI 寄托著我們對(duì)更加人性化互動(dòng)方式的期許,但就像所有的 AI 技術(shù)一樣,它的推廣更伴隨著關(guān)注和質(zhì)疑。首先,情感 AI 是否真的能夠準(zhǔn)確解讀人類的情感?在理論上,這項(xiàng)技術(shù)的確能夠使服務(wù)、設(shè)備和技術(shù)的體驗(yàn)更加豐富,但從現(xiàn)實(shí)的角度來看,人類的情感本質(zhì)上是模糊和主觀的,早在 2019 年就有研究人員曾對(duì)這項(xiàng)技術(shù)提出質(zhì)疑,表示面部表情并不能可靠的反映人類的真實(shí)情感,因此單純依賴機(jī)器來模擬人類的面部表情、體態(tài)和語調(diào)來理解情感, 存在著一定的局限性。
其次,嚴(yán)格的法規(guī)監(jiān)管也一直是 AI 發(fā)展路上的絆腳石,比如歐盟的 AI 法案禁止在類似教育等領(lǐng)域使用使用計(jì)算機(jī)視覺情感檢測(cè)系統(tǒng),因此可能會(huì)限制某些情感 AI 解決方案的推廣;像是美國(guó)伊利諾伊等州也有法律禁止在未獲許可的情況下進(jìn)行生物識(shí)別數(shù)據(jù)的收集,這就直接限制了情感 AI 某些技術(shù)使用的前提。同時(shí),數(shù)據(jù)隱私和保護(hù)更是一個(gè)重要問題,情感 AI 通常應(yīng)用于教育、健康、保險(xiǎn)等對(duì)數(shù)據(jù)隱私要求格外嚴(yán)格的領(lǐng)域,因此確保情感數(shù)據(jù)的安全和合法使用,是每一家情感 AI 公司都需要面對(duì)的課題。
最后,不同文化地域的人與人之間進(jìn)行交流和情緒解讀都是難題,對(duì) AI 來說更是考驗(yàn),比如不同地區(qū)對(duì)情感的理解和表達(dá)方式各不相同,這可能影響情感 AI 系統(tǒng)的有效性和完整性,此外,情感 AI 在處理種族、性別和性別認(rèn)同偏見時(shí),也可能面臨不小的困難。
情感 AI 不僅承諾著減少人力的高效,還有著讀人心的體貼,但它是否能夠真的成為人類互動(dòng)中的萬能解決方案,還是會(huì)成為和 Siri 大同小異的智能助手,在需要真正情感理解的任務(wù)中表現(xiàn)平平?或許在未來,AI 的「讀心術(shù)」將會(huì)顛覆人機(jī)甚至是人類互動(dòng),但至少在現(xiàn)在,真正理解和回應(yīng)人類情感,或許還是更需要人的參與和審慎。
以上就是巨頭搶布局,VC 狂撒錢,為了能讓“AI 讀心”這些公司卷瘋了的詳細(xì)內(nèi)容
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。



