第769章 大語言模型訓練
方夜白提示您:看後求收藏(第769章 大語言模型訓練,都重生了,誰還做普通人啊,方夜白,叢書網),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
許蔚蔚仔細想想,好像確實是這個道理。
陳陽現在跟範新平和夏君關係都很好,而且天下系的企業全都在江北,在這裡已經擁有非常大的影響力了。
就算是徐家想要動陳陽,他們也要好好掂量一下。
“你們也開始處理手上的股票,儘快在一個月內處理完。”
孟建國此時視線轉向了兩個弟弟,然後便又看向許松年道,“等股市崩盤,你安排一下,我們一起見見這個陳陽。”
“好。”
其實這些天,不止孟家和許家在發生這樣的對話。
只要和陳陽有一定的關係的,都在討論他的這一系列操作。
別的公司遇到了這種國際巨頭的起訴都要打起十萬分精神來應對,因為一旦輸了,損失會非常慘重。
哪怕不知道天下電子的老闆是誰,但是有些聰明人也看出來了點端倪。
天下電子感覺就像是早就知道了一樣,甚至還大聲的在呼喚“e on baby”,唯恐谷歌不來起訴自己。
他們甚至在谷歌發起訴訟的第一時間,就同時發起反訴。
在國內這麼操作沒問題,但是問題是天下電子在米國也同一時間發起了。
這就意味著天下電子早有準備,已經安排了律師在米國,就等著谷歌起訴。
在所有人的注意力都集中在了天下電子釋出會和這場訴訟上的時候,陳陽到了位於懷寧區的天下雲公司。
如今天下雲已經有超過一千個員工,直接在這裡租了一棟大廈,負責天下雲的業務。
這裡有一個龐大的研發團隊,其中最核心的便是由資料科學家,機器學習工程師和軟體開發人員組成的大語言模型研發團隊。
這些人要麼是從各大頂尖院校畢業的,要麼是從國外高薪挖回來的。
為了保持人才不斷層,天下電子還和東海全部的理工學校建立了合作關係。
從專案合作、資源共享、聯合培養、科研平臺共建以及直接出錢給高校,進行這方面的人才培養。
按照陳陽的計劃,將逐步擴充套件到長三角區域所有的頂級高校。
而且合作的專案不只是演算法,還有晶片和通訊領域,只要是天下電子需要的人才,陳陽都願意花錢去砸。
“語言模型訓練的怎麼樣了?”
GPT這種大語言模型和所有主流的人工智慧一樣,都是基於深度學習神經網路的東西,是海量資料訓練出來的產物。
它總共有五個關鍵節點,第一個也是最重要的大型神經網路模型,其次深度學習、大規模資料訓練、不斷最佳化演算法以及硬體支援。
神經網路學習其實是模擬人腦的神經元網路,這個技術早在20世紀80年代就提出了,如今基礎的神經網路技術和演算法已經存在。
硬體方面,天下雲這裡安裝了30臺超高效能的GPU,專門用來訓練大語言模型。
深度學習方面,斯坦福和MIT等名校在這方面具有全球領先的研究和教育資源,陳陽這些年持續在米國挖這方面的人才,缺的只是海量的資料。
2005年,網路上能收集到的文字和資料還相對較少,但是兩年時間過去了,網際網路上已經充滿了可用的資源。
比如新聞網站、論壇、部落格等等,還有英文網際網路上資料也都是呈現幾何式增長。
人人網這一年多的資料,也全部都是儲存在天下雲,已經為訓練大語言模型打下了基礎。
蘇澤迅速回答道,“已經有一定成效,但還是隻能回答一些簡單明確的問題,距離你要求的還有一定的差距。”
“最主要的麻煩在哪裡?”
蘇澤苦笑著道,“還是最佳化演算法的問題
本章未完,點選下一頁繼續閱讀。