欧美人与性动交α欧美精品_色综合久久天天综合_亚洲s黄在线_youjizz国产在线观看_男女猛烈拍拍拍无挡视频免费

<ul id="y4ace"><sup id="y4ace"></sup></ul>

<abbr id="y4ace"><center id="y4ace"></center></abbr>

首頁 > 資訊 > > 正文

Google DeepMind 學者研發(fā) Focused Transformer ，擴展大模型輸出長度限制

2023-07-11 17:36:36 來源: ZAKER科技

【資料圖】

品玩 7 月 11 日訊，據(jù) Arxiv 頁面顯示，Google DeepMind 研究團隊近日聯(lián)手華沙大學和波蘭科學院等機構，研發(fā)一項名為 Focused Transformer 的技術。

Focused Transformer 技術旨在通過對比訓練來擴展上下文長度的方法，可以用于大型語言模型。Focused Transformer 技術通過對比訓練來增強 ( key, value ) 空間的結(jié)構，從而擴展了上下文長度。這項技術使得已經(jīng)預訓練的大型語言模型可以被重新訓練來延長它們的有效上下文。

論文顯示，研究團隊使用一款名為 LongLLaMA 的大模型進行測試。經(jīng)過實驗，研究團隊已經(jīng)成功使用 LongLLaMA 模型在密碼檢索任務中實現(xiàn)了 256K 的上下文長度。

標簽：

“這必將是一屆成功的冬奧會”2022-01-29 14:44:13
汪明義：辦學成就離不開使命堅守2022-01-29 14:44:13
戰(zhàn)略支援部隊某部齊抓共管建設過硬基層2022-01-29 14:44:12
軍地聯(lián)手，年貨送進冰封海島2022-01-29 14:44:12
戰(zhàn)鷹翱翔，物資直抵雪海孤島2022-01-29 14:44:11
全國青聯(lián)開展聯(lián)誼活動與港澳臺青年共迎新春2022-01-29 14:44:11
樂高樂園、國家大熊貓繁育基地落戶北京，今年開建！2022-01-29 14:44:10
戴兵呼吁推動國際社會在敘利亞反恐問題上加強合作2022-01-29 14:44:09
《2022年春節(jié)聯(lián)歡晚會》多項創(chuàng)新值得期待2022-01-29 14:43:15
北京冬奧會讓新疆“冷”資源“熱”起來2022-01-29 14:43:15

合肥發(fā)布雷雨大風黃色預警未來一周降水較常年偏多八成

劇本殺內(nèi)容創(chuàng)作市場遇冷內(nèi)容作者轉(zhuǎn)行自救

圖解：如何看懂單板滑雪

守護百姓“錢袋子” 業(yè)界共筑反詐安全防線

金正恩視察一家軍工廠

<abbr id="aygui"><center id="aygui"></center></abbr>

<center id="aygui"></center>

<table id="aygui"><dl id="aygui"></dl></table>

<abbr id="aygui"><dl id="aygui"></dl></abbr>

<sup id="aygui"></sup>