當前位置:首頁 > 科技 > 正文

與動物語言交流,這件人做不到的事,AI能勝任?

撰文:青蘋果

編審:HS

排版:李雪薇


你看過《忠犬八公的故事》嗎?
這部評分很高的電影,完美诠釋了秋田犬小八和主人公帕克之間的情誼。小八每天都想方設法去車站等已故的主人,風雨無阻,一等就是十年。

還有不少優秀的影視作品都反映了同一個主題:人和動物的交流。

了解動物是一個難題。首先,動物甚至有“語言”嗎?如果它們有自己的語言,除了生存的基本知識之外還有很多話要說嗎?

AI 正在幫我們解答這些問題。



“神秘外星人”

使用 AI 探索動物語言是合理的。畢竟,人工智能已被證明在破譯古代人類語言方面非常有效。

一個由國際科學家組成的團隊,最近發起了一個雄心勃勃的"鲸語翻譯計劃"(Project CETI)。

他們選擇的研究對象生活在充滿神秘魅力的藍色海洋中,是一種極具情感和智慧的、令人着迷的“神秘外星人”:抹香鲸(Physeter macrocephalus)。

抹香鲸外形龐大,體型似魚,用肺呼吸,體重超過 50 噸,體長可高達 18 米,屬于體型最大的齒鲸;頭部巨大,可占整個身體的 1/3,下颌較小,僅下颌有牙齒,頸部較短,鼻孔為噴孔,位于吻端,前肢成鳍,前臂和後肢退化,無背鳍,尾似魚,靠尾擺動;具有極強的潛水能力,不僅在深度上,而且在下潛時間上都是哺乳動物的 No.1。

圖丨你可能想不到它的主食是什麼吧?深海中的大王烏賊是它的最愛


受“探索外星智能”(SETI, search for extraterrestrial intelligence)的啟發,項目負責人 David Gruber 聯合科學家和研究者們試圖進行一次前所未有的探索: 破譯抹香鲸的語言,以實現人鲸對話。 由此,鲸類翻譯計劃(Project CETI , Cetacean Translation Initiative)誕生了。

通過傾聽、解讀抹香鲸的聲音,獲得與它們交流的方式,以運用最前沿的技術來造福人類,造福地球的生物,達到珍愛生命、保護生命、人與自然的和諧共處的宗旨。

該項目采用非營利性的模型,由來自紐約城市大學、UC 伯克利、MIT、哈佛、谷歌研究院和《國家地理》等知名學府、研究和環保機構的多領域專家共同組成,彙集了頂尖的密碼學家、機器人專家、語言學家、AI 專家、技術專家和海洋生物學家。

他們一緻認為,隻有采用跨學科的研究思路,将相關方向的專業知識融會貫通,才能更全面、深入、透徹的了解鲸類的語言。其關鍵步驟如下:

  • 記錄:從各種傳感器收集鲸魚通信和行為數據的大型縱向的多模态的數據信息;
  • 過程:協調和處理多傳感器的數據;
  • 解碼:借助 ML 技術,構建鲸魚的交流模型并描述其結構,将其與行為緊密聯系起來;
  • 編碼和回放:通過一次次的交互式播放實驗,改進并完善鲸魚語言模型。
因而,多種最新的技術也有了更廣闊的用武之地,涵蓋 AI、機器學習(ML, Machine Learning)、密碼學和機器人技術等等。



正如阿波羅計劃的地球上升照片一樣,CETI 的發現和進步極有可能重塑人類對其在這個星球上所處地位的理解。



該項目的主要研究工作概括為以下幾點:

  • 開發最精密的機器人技術,包括與國家地理學會的探索技術實驗室合作,在傾聽鲸魚的聲音的同時,将其聲音融入語境之中。
  • 部署“核心鲸魚監聽系統”,這是一種新穎的水聽器陣列,可用于研究 20×20 公裡的野外地點的鲸群。
  • 多米尼加的抹香鲸項目成效顯著,已捕獲了關于鲸魚聲音、社會生活和行為的大量數據。
  • 創建大數據管道,以檢查記錄的數據,并使用先進的 ML、自然語言處理(NLP, Natural Language Processing)和數據科學(DS,Data Science)對其進行解碼。
  • 增強夥伴合作關系,啟動公共界面、數據可視化、溝通平台和領導力倡議,以參與并促進全球社區的發展。


圖 |鲸魚生物聲學數據收集的示意圖


第一個問題,為什麼選擇的是抹香鲸呢?

在此,我們解答你心中的第一個疑問:人類借 AI 嘗試和動物交流,為什麼要選抹香鲸?

其實,相對于所有的生物而言,抹香鲸擁有最大的大腦,并且與人類有着驚人相似的特征。

抹香鲸具有更高層次的功能,如有意識的思考和未來規劃,有豐富的情感體驗,可以表達和感受同情、愛、痛苦和直覺等等。

它的生物聲學系統如下圖所示。在 A 中,抹香鲸頭包括鲸蠟器官(c),一個充滿近 2000 升蠟狀液體的腔體,以及垃圾艙 (f),包含一系列起到聲透鏡作用的晶圓狀體。兩者相當于兩個連接管,在大型成熟雄鲸中形成一個長約 10 米、孔約 0.8 米的彎曲圓錐形角。在頭部前側的“聲唇”(i)發出的聲音,通過彎曲的喇叭進行傳遞,在出口表面産生平坦的波面。而 5-B 中展示的是,抹香鲸回聲定位和尾波咔哒聲的時間結構。



另外,它們生活在母系社會和多元文化社會,有方言和強大的多代家庭紐帶。

現代鲸魚作為海洋環境的超強“管家”,已有超過 3000 萬年的曆史了,從時間節點上看,已是最早原始人類的5倍,而我們對這些動物的了解才隻是剛剛開始。

第二個問題,為何現在去研究?

這個問題得從 20 世紀 60 年代末的一個發現說起。

當時,包括 CETI 首席顧問 Roger Payne 博士在内的科學家發現,鲸魚會彼此唱歌。

如下圖所示,他的唱片《座頭鲸之歌》掀起了一場聲勢浩大的“拯救鲸魚”運動,這是曆史上最成功的保護行動之一。


這場運動最終推動了《海洋哺乳動物保護法》的頒布,該法案标志着大規模捕鲸時代的結束,并有效拯救了幾個瀕臨滅絕的鲸魚種群,留存下了地球上最神秘的聲音。

迄今為止,工程學、AI 和語言學的進步使得更深入地了解鲸魚和其他動物的交流成為可能,打破了之前遙不可及的神話。

在這個項目中,他們會使用自然語言技術來研究分析抹香鲸的 40 億個交流代碼,将每個聲音與特定的背景聯系起來,這一過程至少需要五年時間。 如果該團隊實現了這些目标,下一步将是開發和部署一個互動聊天機器人,與生活在野外的抹香鲸進行對話。

第三個問題,AI 讀懂動物“語言”的潛力如何?

我們都知道,人類通常非常擅長識别他們熟悉的動物叫聲的聲學差異。

而随着基于信号分類算法變得更加先進,我們有理由相信,人工智能将很快達到可以比人類做得更好。

現在已經看到一些成功的迹象。2017 年,科學家們開發的程序,能夠以大約 90% 的準确率識别出許多不同的狨猴叫聲。

狨猴是群居的群居動物。他們的“詞彙”包括 10 到 15 個叫聲,每個都有自己的含義。研究表明,像人類嬰兒一樣,小狨猴通過聽到其他狨猴與它們交談來學習交流。猴子類人的交流系統使它們在研究語言、社會交流或發聲的科學家中很受歡迎,攜帶自閉症相關突變的狨猴也是研究改良這種疾病的良好模型。


一支麻省理工團隊開發了一種算法,将來自狨猴呼叫的頻率模式轉換為圖片,然後将這些類似字母的圖像傳遞給人工神經網絡進行分類。最終,該算法以 80% 的準确率從背景噪音中篩選出猴子的談話,并且在 90% 以上的情況中正确識别出猴子發出的聲音。

同年,另一個團隊讓 AI 僅根據給羊的面部表情來識别羊是不是處于困境之中。

在這項研究中,劍橋大學團隊首先根據綿羊疼痛面部表情,列出了與不同疼痛程度相關的幾個“面部動作單元”(AU),然後在 480 張綿羊照片中手動标記了這些 AU——鼻孔變形、每隻耳朵的旋轉和每隻眼睛的縮小等等。

然後,他們訓練機器學習算法通過将 90% 的照片及其标簽提供給它,并在剩餘的 10% 上測試該算法。最終,該程序識别 AU 的平均準确率為 67%,與普通人的準确率差不多。而且,改進訓練程序還能進一步提高了準确性。團隊認為,他們的方法也适用于其他動物,可以為動物帶來更好的診斷和治療方案。

未來,如果能同時結合聲音+圖像的想法,我們可以更全面地了解動物可能想說什麼。

借助 AI,擁有一個能夠翻譯動物語言的“谷歌翻譯”固然是好事,更重要的是,目前一些物種正處于生存的關鍵時刻,随着技術的進步和成熟,我們可以在技術的支撐下,建設一個對人類和動物都更光明、更密切的未來。

點這裡關注我記得标星~





熱門視頻推薦

你可能想看:

有話要說...

取消
掃碼支持 支付碼