• <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
  • <s id="gswm4"><em id="gswm4"></em></s>
    • <s id="gswm4"><em id="gswm4"></em></s>
      首頁 > 財經 >

      上海人工智能實驗室發(fā)布多模態(tài)語料


      (資料圖片)

      人民日報上海8月15日電 (記者沈文敏)近日,上海人工智能實驗室宣布聯合語料數據聯盟成員單位,共同開源發(fā)布“書生·萬卷”1.0多模態(tài)預訓練語料。

      “書生·萬卷”1.0集合了語料數據聯盟成員豐富的內容積累與上海人工智能實驗室的數據處理能力等優(yōu)勢,將為學術界及產業(yè)界提供高質量大模型多模態(tài)預訓練語料。本次開源的數據總量超過2TB,具備多元融合、精細處理、價值對齊、易用高效等四大特征。

      本次開源的“書生·萬卷”1.0包含文本、圖文、視頻三部分數據集。其中文本數據來自網頁、百科、書籍、專利、教材、考題等,數據總量超過5億個文檔,數據大小超過1TB,覆蓋科技、文學、媒體、教育、法律等多個領域;圖文數據主要來自公開網頁,經處理后形成圖文交錯文檔,總量超過2200萬個,數據大小超過140GB(不含圖片),覆蓋新聞事件、人物、自然景觀、社會生活等多個領域;視頻數據主要來自中央廣播電視總臺和上海文廣集團,包含新聞、影視等多種類型的節(jié)目影像,總計視頻文件數超過1000個,數據大小超過900GB,內容覆蓋軍事、文藝、體育、自然、知識、影像藝術等方面。

      關鍵詞:

      責任編輯:Rex_16

      推薦閱讀
      91亚洲精品色午夜麻豆,91美女在线视频,性欧美tube精品,久久99精品久久久久久野外
    • <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
    • <s id="gswm4"><em id="gswm4"></em></s>
      • <s id="gswm4"><em id="gswm4"></em></s>
        主站蜘蛛池模板: 少妇中文字幕乱码亚洲影视 | 99re66热这里只有精品17| 色窝窝亚洲av网| 日韩在线一区高清在线| 国产日韩欧美中文字幕| 亚洲aⅴ男人的天堂在线观看 | 欧美freesex黑人又粗超长| 欧美另类xxxx图片| 国产精品爽爽影院在线| 亚洲最新中文字幕| 77777_亚洲午夜久久多人| 欧美精品dorcelclub全集31| 图片区另类小说| 亚洲精品NV久久久久久久久久| 95老司机免费福利| 欧美日韩成人在线观看| 国产精品十八禁在线观看| 亚洲一区精品视频在线| 鲁大师成人一区二区三区| 日韩av激情在线观看| 国产三级在线观看完整版| 中文字幕专区高清在线观看| 精品午夜福利1000在线观看| 好吊色青青青国产在线观看 | 中文字幕第一页亚洲| 美国式禁忌免费| 天天想你视频免费观看完整版高清中文| 人妻aⅴ无码一区二区三区| 999在线视频精品免费播放观看 | 久久人妻无码中文字幕| 色婷婷精品视频| 婷婷久久综合网| 亚洲福利秒拍一区二区| 亚洲伦理中文字幕| 日韩免费一级片| 喝茶影视喝茶影院最新电影电视剧| 一级毛片在线完整观看| 波多野结衣种子网盘| 国产男人午夜视频在线观看 | 午夜男女爽爽影院网站| 99热热久久这里只有精品166|