曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

新智元報道

編輯:yaxin

【新智元導讀】

從深度學習演算法、計算機視覺演算法到AIoT演算法,從開源框架曠視天元到AI生產力平臺Brain++,曠視十年故事,曠視首席科學家、曠視研究院院長孫劍講給你聽。

萬萬沒想到,我和小夥伴們被曠廠拿去「煉丹」了。

沒錯,就是這個煉丹爐!

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

站在爐子中央,各種演算法程式碼眼前飛閃,讓我體驗了一把時空穿梭的快樂。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

OMG!真·顱內高潮。。。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

業界認為「煉丹」過程正如演算法研究過程。

眾所周知,AI的三大支柱分別是資料、演算法、算力。

那麼在煉丹過程中,資料便是金木水火土等自然元素,演算法框架是用來煉丹的爐子,算力就是煉丹爐下的三昧真火。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

元素全不全,爐子好不好,火旺不旺決定了AI開發者能不能練出一顆AI的「靈丹妙藥」。

從2014年至今,中國新一代煉丹宗師曠視經過多年的磨練打磨,打造了「煉丹房」—— Brain++。

MegEngine(深度學習框架天元)是丹爐,MegData(資料管理平臺)是元素,MegCompute(深度學習雲計算平臺)便是那三昧真火。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

這次,「煉丹房」 Brain++ 迎來了全新升級!

升級後的煉丹房,「自動」成為最大特色,煉丹師們不再需要經過九九八十一天這麼漫長的時間來煉製丹藥。

這個平臺提供了怎樣的最新功能,讓AI開發者們更輕便地生產演算法?

Brain++「神助攻」:一個「旗幟檢測」演算法誕生

熟悉曠視的人都應該知道,Brain++ 是曠視在AI領域創業多年的致勝法寶。

它將演算法、算力和資料能力集為一體,核心能力包括:

資料的處理、清洗和管理能力,算力的共享、排程和分散式能力,演算法的訓練、推理及部署能力。

全面覆蓋了從 AI 生產(輸出演算法模型)到應用(實現演算法工程化封裝)各環節。

因此,Brain++被內部定義為「AI生產力平臺」。

但時局變了,資料滿溢,算力飛昇,演算法無處不在。許多開發者們真正面臨的挑戰是:如何讓演算法生產更加高效?

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

要知道,演算法生產能力決定演算法價值上限。

當前的演算法生產不僅僅是模型的訓練,還包括需求分析、資料處理、上線部署、落地應用4個環節。

過程標準化是影響演算法生產的關鍵要素,只有過程標準化才能實現演算法生產的自動化。

讓演算法生產邁向自動化時代,便是Brain++迎接這一挑戰的底氣!

自動化的資料管理和質檢——自動推薦合適的訓練演算法和模型——自動檢查演算法準確率並給出最佳化建議便是升級後Brain++的最新功能。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

舉個真實場景中的例子,

在鋼鐵冶煉廠中,存在一些比較危險的裝置。根據生產安全的要求,這些裝置周圍需要插小紅旗來做警示和標誌。

如何能夠檢測出小紅旗是否還插著?

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

這就需要做一個紅旗檢測的模型,透過安裝的攝像頭來進行自動化檢查。

需求明確後就需要進行演算法生產了。

首先,Brain++提供自動化的資料管理和質檢,包含十餘種質檢策略,這個過程中可以排除無意義的資料。

下面這2個紅旗就是透過自動化平臺所發現,圖片的畫風其實和我們真實場景中的差別非常大,就屬於一些無效資料,或者說噪音資料。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

平臺自動檢測出後,就會在訓練模型前幫你剔除。

然後便開始模型自動化訓練,平臺會根據部署資源的要求,為開發者自動推薦最合適的訓練演算法和策略。

這一環節中,就不需要開發者自己去學習到底應該怎樣去選擇演算法或者調優模型。

接下來便是演算法調優分析,Brain++整合十餘大類不同的結果分析和對應的調優策略,比如漏檢/誤檢結果呈現。

當紅旗檢測模型訓練完成後,將其放到實際應用場景中測試,黃色框就是一次訓練後的演算法檢測出來紅旗的位置。

說明這一演算法存在明顯誤檢問題,特別可能在這樣的一個場景誤檢率比較高,AI生產力平臺便可幫助開發者自動發現問題,並給出針對性最佳化建議。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

總的來看,當我們分析完想要做一個旗幟的檢測需求之後,首先需要2個小時來做一個影象的質檢和旗幟的標註,之後選擇一個GPU的訓練環境,模型訓練的時間大概花費一個小時左右的時間。

在上線部署後,根據剛剛提到的分析和調優策略,研究人員進行了2輪左右的迭代,一個「旗幟檢測」演算法就誕生了!

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

你所感受到的便捷,是曠視透過總結過去10年演算法生產落地的海量經驗,探索出一套「快速、低成本生產演算法」的模式,並將其沉澱在Brain++。

這十年,曠視AI創新走過怎樣一個歷程?

7月16日,由曠視首席科學家、研究院院長孫劍領銜的技術團隊在2021曠視技術開放日(MegTech 2021)上分享了曠視十年來在AI技術上的實踐和思考。

十年實踐,首席科學家孫劍發AI「靈魂」三問

今年,是曠視成立的第十年。

我們來聊一聊曠視這十年的進階之路。

首席科學家孫劍以曠視為例,總結了過去十年中國AI技術價值的發展歷程。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

2011年前後,AI發展的重點是基礎科研。基礎科研的關鍵點是突破單點演算法,讓AI率先在網際網路等數字化程度高等領域應用落地,變得真正可用。

2015年起,AI需求越來越多,AI商業化落地也越來越多。這個過程中,演算法在不斷拓展應用的邊界,從演算法到軟硬結合,AI創造的價值越來越大。

從2020年開始,AI成為新基建的重要部分,持續降低演算法門檻,讓AI生產變得更加容易,基礎設施需要AI普惠化。

AI有沒有用?AI在哪裡用?AI易不易用?

這是AI行業的「靈魂」三問,是所有AI企業需要回答的問題。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

孫劍認為,AI有沒有用歸根到底是看AI基礎科研有沒有突破。

基礎科研是AI創新突破的基石,需要長期主義的堅持。

對曠視來說,要構建科學價值和產業價值統一的基礎科研體系。

十年來,曠視不斷突破創新:

在學術上發表85篇頂級會議論文,在競賽上斬獲40項冠軍,在實用上研發了包括ShuffleNets系列在內的眾多基礎模型,已經廣泛應用在手機等智慧裝置上,推動軟硬協同發展。

基礎科研有了,落地才是科研的價值,這就需要解決「AI在哪裡用」的問題。

對於曠視,一直瞄準的是消費物聯網、城市物聯網和供應鏈物聯網三大場景。

AI是核心能力,IoT是落地場景,在數字世界與物理世界融合的智慧化時代,AI演算法正在為產品帶來更多的價值提升。

曠視認為,「演算法不只讓很多產品從好變更好,更能讓產品從不可能變可能。」

在曠視十年的AI實踐落地中發現,演算法已不再僅僅是「軟體物料」,而是成為「核心元件」。

從科研到落地,演算法正在創造越來越大的價值,也在開始重新定義軟硬體。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

曠視研究員範浩強在MegTech 2021上的分享

AI落地是我們所有人都在講的問題,但是當前,大量演算法生產過程還是非標準化。因為非標準化所以演算法生產過程充滿不確定性。

曠視認為,落地實用是檢驗演算法的最高標準之一,而生產落地實用演算法的過程「只有先標準化才能自動化」,才能更進一步實現規模化的普惠易用。

從2014年至今,持續打磨升級的AI生產力平臺Brain++,就是曠視推動演算法生產邁向自動化時代的AI基礎設施。

為什麼是曠視?

不是煉丹「上癮」,是AI進化

曠視是一家靠演算法起家的公司。

準確來說,可以細分為兩類:

一類是以深度學習(DL)和計算機視覺(CV)為基礎的核心演算法。

另一類則是行業演算法 (或者稱AIoT演算法)。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

曠視的演算法之路,經歷了從核心演算法突破,到行業演算法落地和創新,再到演算法生產平臺的拓展過程。

MegTech 2021上,曠視展示了其演算法量產星空圖。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

演算法量產不是一個單一產品,更不是「上癮」,而是一種生產模式的理念革新和生產力進化。

曠視現場透過一系列技術Demo演示,系統展示了其最新的技術成果。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

曠視研究院推出了面向伺服器和下一代AI晶片的通用模型RepVGG,其在開源後Github star已超過1800。

還推出全景影片實時拼接演算法。

全景影片拼接的實現,需要多個攝像頭在同一場景下采集不同方向影片,然後逐幀地將各個方向的影片幀拼接起來,最終得到360度全景影片,甚至360度*180度的球面全景影片。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

其核心是運用基於光流的多攝AI拼接演算法,同時依靠實時動態無縫拼接網路模型,解決了多攝拼接計算量大、拼縫明顯,以及拼接無法動態更新的技術難題。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

還有單目3D車路感知:僅用單目可見光相機,就可以實現車路資訊的3D感知。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

曠視MegTech 2021上還展示了,目前效能最強的端到端實時全卷積全景分割演算法,以及挑戰經典,目標檢測架構創新的YOLOF。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

從基礎科研,到行業落地,再到基礎設施,這是人工智慧技術價值躍遷的三個關鍵。

曠視正是沿著這樣的路線在不斷創新,務實落地。預研一代、孵化一代、交付一代,這是曠視技術創新研發模式。

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問

在技術開放日現場,曠視將這一套創新研發模式首次對外完整的呈現出來。

孫劍總結道,「聚焦最優秀的人才,一起做最好的科研,透過產品讓科研成果創造價值,不斷探索新領域,這是曠視的秘訣,也是AI技術價值躍遷的秘訣。」

對了,忘了告訴你,這是一個北京新晉AI網紅打卡聖地。

不要太燃~

曠視AI“煉丹房”Brain+再升級!首席科學家孫劍發AI“靈魂”三問