圖為全球開放瞬變望遠鏡陣列(GOTTA)模擬圖。
2024年9月,賽博創(chuàng)力在杭州阿里云云棲大會上亮相,其推出的具身智能AI互動玩具成為焦點。展臺前,一名小男孩正與AI小狗聊天。
今年1月,阿里線下快閃活動上,觀眾體驗愛富耳機。
一款耳機、一個玩偶、一臺天文望遠鏡,在過去這是風馬牛不相及之物。
得益于AI,這三者都變了模樣,互相之間也有了聯系。耳機能做到外語同聲傳譯,也能把語音實時變成文字;玩偶能根據自己的形象設定,用相應的語調和性格跟人聊天;望遠鏡可以自行將“目光”望向天空,能整理觀測到的數據,還能跟全世界其他望遠鏡協同合作……
它們背后,都有阿里通義千問大模型的身影??窗⒗镞@家平臺型科技企業(yè)的發(fā)展,不妨將目光投向阿里之外。
“所說即所得”
采訪結束后10秒,智能硬件企業(yè)艾克思的聯合創(chuàng)始人公瑾發(fā)來一個錄音文件、一份錄音文檔整理、一個會議紀要。這是本報記者從業(yè)以來,第一次由采訪對象整理錄音。
電話采訪時,公瑾戴著自家新產品“愛富耳機”,采訪過程中,耳機實時錄音并整理文字。經過對比,準確率幾乎接近原話,作為一份采訪記錄,已經可以媲美此前需要花費數小時的人工錄音整理。
整理錄音,只是這個AI耳機的功能之一。去年11月推出的這款耳機,還可以充當AI助理,就在我們談話完成后,它也生成了一份采訪總結。它還可以做同傳,戴著它與外國人聊天,耳機可以實時將對方的話翻譯成中文,連語氣和情緒都同步傳遞。
這也不是全部功能。公瑾告訴記者,在AI支持下的耳機,真正的變化是由用戶需求驅動開發(fā),隨時可能出現全新功能?!坝布m然是固定的,但后臺隨時可以變化,取決于用戶在日常使用中如何與它溝通?!?/p>
在智能硬件行業(yè),艾克思已深耕15年,在深圳和杭州有兩個團隊共同開發(fā)。深圳團隊負責供應鏈和硬件研發(fā),杭州團隊負責AI模型參數調優(yōu)、大模型接入、APP及后臺開發(fā)等工作。
當然,在杭州的團隊還有個優(yōu)勢,離阿里更近。
2023年12月,AI耳機項目立項。公瑾說,從一開始,耳機就用到了通義千問大模型的能力和百煉平臺的開箱即用能力,將所有信息與數據交由通義千問大模型處理。其中,用到了語義分析、情緒識別等多個模型。
雙方分工明確,艾克思的技術人員負責耳機硬件及應用程序的開發(fā),阿里負責大模型的開發(fā)?!拔覀兺瓿蓴祿杉蛿祿ǖ拦ぷ?,然后數據都在阿里云服務器處理及開發(fā)?!?/p>
比如,錄音轉文字時,一個很重要的需求是非常低的延時,最好是“所說即所得”。在雙方合作之下,艾克思與阿里云四五個研發(fā)部門同時合作,僅僅用了一個星期時間,就將延時從500毫秒降到30毫秒,對于用戶來說,幾乎已經感受不到延時。就在我們講話的同時,錄音文字稿已經同步出現在手機屏幕上。
再比如,耳機上的同聲傳譯功能,實際上是從外文語音到中文語音的直接翻譯,而不是先將外文翻譯成中文文字,再輸出中文語音。其所依賴的,也是大模型對語音的處理能力、對聊天上下文的理解能力,這在過去很難想象。
在很多方面,中國企業(yè)已經進入無人區(qū),AI耳機就是其中一例。這意味著,有很多問題需要摸索著解決。艾克思與阿里云的團隊互相配合,基本每天都會有一個小型會議,絕大多數問題當天能得到反饋。
“對于今天的硬件公司來說,自己去做大模型的基座研究沒有太大價值,因為更新迭代太快了?!惫嬖V記者,“所以找到一個非??尚刨嚨?、高水平大模型合作方,對我們至關重要”。
如今,雙方合作越來越成熟,已經可以用更快的方式、更低的成本將AI接入產品。公瑾認為,如果再做下一款AI耳機產品,研發(fā)周期將從過去的兩年,變成“頂多一兩個月”。
新“聊天搭子”
“賽博大舞臺……”
北京市昌平區(qū),中國移動園區(qū)內,這段語音在十平方米的辦公室里此起彼伏地響起。辦公室里,擺滿桌子、椅子、電腦和玩偶。此刻是早上十時,辦公室里幾個年輕人擠在一起,每個人守著一張滿是玩具的辦公桌。
這里是北京賽博創(chuàng)力科技有限公司,一家AI潮玩企業(yè),也是一家初創(chuàng)并不久的中小企業(yè)。其創(chuàng)始人、首席執(zhí)行官周羿旭告訴記者,公司只有9個人,其中7個是00后,大多是技術人員。這位95后笑稱,自己是“整個團隊里最老的”。
對于這個年輕的團隊來說,手辦、潮玩伴隨他們長大。如今,在AI時代來臨后,他們希望借助新技術,讓這些玩具成為更鮮活的陪伴。
巴掌大的底座上,周羿旭放上一個來自三星堆的青銅人面像文創(chuàng)。一放到底座上,它似乎就“活”了,開口說起話來,對于記者提的問題也都對答如流,仿佛它生來就該這么說話。
將一只“哆啦A夢”里的大雄手辦放上去后,它開始用日語打招呼,本報記者提醒它說中文,立刻切換成了中文對話。此刻它的說話語氣和風格,與印象中的大雄毫無二致。
這些“對話”,對人來說近乎本能,但對AI來說,要實現對話的流暢自然,需要攻克語境理解、多輪對話、知識圖譜、實時響應等諸多難題。從“傾聽”到說出符合角色的話,都需要大量技術支持。
更為難得的是,就在這個巴掌大小的底座上,已經可以支持3000多個不同角色玩偶對話,支持50多種語言對話。只要有這款底座,再配上特制的角色貼紙,玩偶、擺件、手辦等都“活”了,隨時可以成為相關愛好者的“聊天搭子”。
事實上,最近一段時間以來,AI玩具日趨火爆。不少行業(yè)觀察者認為,AI玩具兼具教育與陪伴屬性,是具有真實需求的AI硬件落地方向。在這個領域,盡管只是中小企業(yè),但賽博創(chuàng)力已經引起了不少人關注。就在過去兩個月中,他們的產品先后亮相巴塞羅那、東京等地的重要展會。
這些逼真的玩具,既誕生于這10平方米的辦公室,也有來自遠方的支持。
從去年六七月份開始,賽博創(chuàng)力就選擇了阿里通義大模型和阿里云的云計算服務器。合作過程中,在通義千問大模型的基礎上進行了諸多優(yōu)化。周羿旭說,在這個過程中,來自阿里云的技術人員會幫助解決底層問題,然后再根據實際需求修改。
雙方溝通非常頻繁,也有著明確的分工。周羿旭說,阿里有五六個不同的技術團隊在與賽博創(chuàng)力對接,既包括產品側也包括技術側,解決語音服務、大模型訓練等諸多工作?!拔覀儓F隊的工作是探索更好玩的應用場景,大模型的基礎能力則依賴阿里,將它們視作水和電一樣的基礎設施?!?/p>
大模型支撐著諸多新玩法。比如,在賽博創(chuàng)力的APP上有一個功能,用戶可以用手機拍一張照片上傳,APP自動一鍵創(chuàng)建一個全新角色。在生成角色過程中需要完成的識別角色、定義性格等,都是大模型輔助用戶去完成的。
技術的不斷發(fā)展,也為AI玩具提供著越來越多的想象力,更多AI玩具正在雙方合作之下迅速開發(fā)。比如AI照相機,既可以拍照,也可以對話。周羿旭舉了個例子,小朋友可以拍下一個不認識的東西,詢問AI相機;或者,給爸爸拍張照,然后讓AI給照片加個胡子?!斑@個過程中,用到的不只是大語言模型,還有多模態(tài)相關的能力。”
“比起其他大模型,阿里云提供的是很全能、很完整的服務。對于我們來說,通義千問最先進的技術或者更新,我們都想去嘗試,只為能讓玩具更好玩?!敝荇嘈裾f。
創(chuàng)業(yè)之路上,這個年輕的團隊飛快前進。今年4月,他們完成了“賽博大舞臺”底座的量產,開始啟動試銷售。來自韓國、日本、印度等幾個國家的合作客戶,也正在積極推動產品海外落地。
在AI時代“觀星”
北京大屯路,奧林匹克公園西側不遠處,是中國科學院國家天文臺。樸素的建筑里,承載著諸多重大任務。墻上,掛著“中國天眼”FAST的照片,FAST運行和發(fā)展中心就在這里。
作為綜合性國家天文研究機構,國家天文臺一直走在技術探索與革新的前沿。如今,人工智能技術在現代天文學中正在發(fā)揮越來越重要的作用。
中國科學院大學天文與空間科學學院博士生、天文大模型“星語”項目組核心技術成員李瑀旸告訴記者,對于國家天文臺的多項科學職能,AI都有很好的促進作用。
比如,在位于河北承德的國家天文臺興隆觀測站,一名科學家的常規(guī)工作節(jié)奏可能是這樣——早上9時到12時觀測選源、晚上六時左右開始觀測并進行數據預處理,直到早上5時,一夜下來精疲力盡。如今,人工智能可以上午整合信息布置好任務,在不同時間節(jié)點調用工具完成相關流程。這背后,是天文大模型成功接入的近鄰星系巡天項目,可實現自主控制望遠鏡進行觀測、分析觀測結果,并給出下一步觀測建議。
再如,天文力量的調配。過去,由于天氣因素影響、軟硬件協議不同、臺址所處時區(qū)等各種原因,天文望遠鏡存在“各自為戰(zhàn)”的情況。而正在開發(fā)的基于多智能體觀測組網,多望遠鏡的協同觀測能夠有可期的進步。
李瑀旸說,這種方式最開始是從愛好者級別的天文望遠鏡開始,今年逐步提升到中型望遠鏡,最后期望運用于更高級別的科學望遠鏡。
如今,AI支持的望遠鏡協同觀測方式正在走向世界。今年4月,在“人工智能賦能的天文學開放科學會議”上,國家天文臺臺長劉繼峰介紹了全球開放瞬變望遠鏡陣列(GOTTA)。這一陣列計劃構建覆蓋全球的百余臺1米級廣角光學望遠鏡網絡,通過小時級高頻巡天監(jiān)測,捕捉超新星、伽馬暴等極端宇宙現象的早期信號,揭示強引力場下的時空本質與宇宙演化規(guī)律。
自2016年以來,國家天文臺和阿里云就已開始長期戰(zhàn)略合作,雙方共同開展跨領域的研究和應用合作,用計算賦能天文研究。人工智能時代的天文學,作為海量數據學科,提供了AI應用和驅動科學發(fā)現的最佳場景之一。
雙方在大模型方面的合作,一個重要節(jié)點是在2023年12月,阿里通義千問720億參數大模型Qwen-72B宣布開源之際。在這一模型的基礎上,國家天文臺成功打造了天文知識能力最強的大語言模型。
在李瑀旸看來,大模型開源能夠讓科學家能夠更專注于模型的應用,而不是花精力在模型訓練上?!皬募僭O生成,到基于科學儀器或軟件的實驗,再到數據處理分析、產生新的假設,整個科研過程,大模型貫穿始終。”
前不久,國家天文臺接入通義千問開源模型QwQ-32B。李瑀旸說,新模型核心價值在于模擬人類專家的復雜推理過程,不僅提升了輸出內容的質量,還使科研人員能夠直觀理解模型的思考路徑,從而評估結論的可靠性。
比如,接入QwQ-32B后的天文觀測助手“星語”,在望遠鏡觀測系統中可實現對觀測目標的自動排序、望遠鏡調度和生成數據報告,將觀測中的人工干預減少了90%。
還有科教應用。在漫長的發(fā)展歷史中,國家天文臺積累了大量專家與各省市師生交互的記錄,這些高質量信息用于大模型訓練,產生了非常優(yōu)秀的垂直領域大模型。如今,在通義千問全新模型幫助下,在天文科教平臺上新增了多項功能,例如多智能體的跨學科圓桌等項目,旨在為20萬所中小學和廣大天文愛好者提供豐富的科教內容。
在AI支持下,“觀星”這件事正在呈現出全新的可能。
北疆新聞 | 內蒙古自治區(qū)重點新媒體平臺,內蒙古出版集團?內蒙古新華報業(yè)中心主管主辦的國家互聯網新聞信息采編發(fā)布服務一類資質平臺。
北疆新聞版權與免責聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權均屬北疆新聞所有,轉載時必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網傳播該消息,并不代表贊同其觀點。
如因作品內容、版權和其它問題需要同本網聯系的,請在見網后30日內進行,聯系郵箱:bjwmaster@163.com。
版權聲明:北疆新聞版權所有,未經書面授權,不得轉載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞 All Rights Reserved互聯網新聞信息服務許可證:15120200009-1蒙公網安備:15010502001245