• <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
  • <s id="gswm4"><em id="gswm4"></em></s>
    • <s id="gswm4"><em id="gswm4"></em></s>
      首頁 > 國際 >

      上海人工智能實驗室發布多模態語料


      (資料圖片僅供參考)

      原標題:上海人工智能實驗室發布多模態語料

      人民日報上海8月15日電 (記者沈文敏)近日,上海人工智能實驗室宣布聯合語料數據聯盟成員單位,共同開源發布“書生·萬卷”1.0多模態預訓練語料。

      “書生·萬卷”1.0集合了語料數據聯盟成員豐富的內容積累與上海人工智能實驗室的數據處理能力等優勢,將為學術界及產業界提供高質量大模型多模態預訓練語料。本次開源的數據總量超過2TB,具備多元融合、精細處理、價值對齊、易用高效等四大特征。

      本次開源的“書生·萬卷”1.0包含文本、圖文、視頻三部分數據集。其中文本數據來自網頁、百科、書籍、專利、教材、考題等,數據總量超過5億個文檔,數據大小超過1TB,覆蓋科技、文學、媒體、教育、法律等多個領域;圖文數據主要來自公開網頁,經處理后形成圖文交錯文檔,總量超過2200萬個,數據大小超過140GB(不含圖片),覆蓋新聞事件、人物、自然景觀、社會生活等多個領域;視頻數據主要來自中央廣播電視總臺和上海文廣集團,包含新聞、影視等多種類型的節目影像,總計視頻文件數超過1000個,數據大小超過900GB,內容覆蓋軍事、文藝、體育、自然、知識、影像藝術等方面。

      關鍵詞:

      責任編輯:Rex_16

      推薦閱讀
      91亚洲精品色午夜麻豆,91美女在线视频,性欧美tube精品,久久99精品久久久久久野外
    • <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
    • <s id="gswm4"><em id="gswm4"></em></s>
      • <s id="gswm4"><em id="gswm4"></em></s>
        主站蜘蛛池模板: 老少配老妇老熟女中文普通话| 亚洲国产成人久久综合一| 一个人看的片免费高清大全| 翁熄系列乱老扒bd在线播放| 欧美亚洲一区二区三区| 国产精品视频全国免费观看| 又大又硬又爽又深免费看| 乳揉みま痴汉电车动漫中文字幕| WWW国产成人免费观看视频| 电影在线观看视频| 把腿扒开做爽爽视频在线看 | 在线中文字日产幕| 四虎影视久久久免费观看| 久久青青草原综合伊人| 黄色中文字幕在线观看| 日本高清不卡在线观看| 国产爽的冒白浆的视频高清| 88aa四虎影成人精品| 伊人久久精品亚洲午夜| 一区二区三区国产精品| 老师好长好大坐不下去| 成人高清毛片a| 国产小呦泬泬99精品| 亚洲人成色77777在线观看| 97久久精品无码一区二区天美| 福利片一区二区| 成人人免费夜夜视频观看| 国产亚洲成av人片在线观黄桃| 久99久热只有精品国产男同| 韩国精品一区二区三区无码视频 | 变态调教视频国产九色| 中文网丁香综合网| 精品久久久久久久九九九精品| 无码熟熟妇丰满人妻啪啪软件| 国产午夜手机精彩视频| 中日韩中文字幕| 看免费毛片天天看| 国产老熟女网站| 亚洲日本天堂在线| 日本娇小videos精品| 日本一区二区三区在线视频观看免费 |