• <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
  • <s id="gswm4"><em id="gswm4"></em></s>
    • <s id="gswm4"><em id="gswm4"></em></s>
      首頁 > 財經 >

      上海人工智能實驗室發布多模態語料


      (資料圖片)

      人民日報上海8月15日電 (記者沈文敏)近日,上海人工智能實驗室宣布聯合語料數據聯盟成員單位,共同開源發布“書生·萬卷”1.0多模態預訓練語料。

      “書生·萬卷”1.0集合了語料數據聯盟成員豐富的內容積累與上海人工智能實驗室的數據處理能力等優勢,將為學術界及產業界提供高質量大模型多模態預訓練語料。本次開源的數據總量超過2TB,具備多元融合、精細處理、價值對齊、易用高效等四大特征。

      本次開源的“書生·萬卷”1.0包含文本、圖文、視頻三部分數據集。其中文本數據來自網頁、百科、書籍、專利、教材、考題等,數據總量超過5億個文檔,數據大小超過1TB,覆蓋科技、文學、媒體、教育、法律等多個領域;圖文數據主要來自公開網頁,經處理后形成圖文交錯文檔,總量超過2200萬個,數據大小超過140GB(不含圖片),覆蓋新聞事件、人物、自然景觀、社會生活等多個領域;視頻數據主要來自中央廣播電視總臺和上海文廣集團,包含新聞、影視等多種類型的節目影像,總計視頻文件數超過1000個,數據大小超過900GB,內容覆蓋軍事、文藝、體育、自然、知識、影像藝術等方面。

      關鍵詞:

      責任編輯:Rex_16

      推薦閱讀
      91亚洲精品色午夜麻豆,91美女在线视频,性欧美tube精品,久久99精品久久久久久野外
    • <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
    • <s id="gswm4"><em id="gswm4"></em></s>
      • <s id="gswm4"><em id="gswm4"></em></s>
        主站蜘蛛池模板: 182tv免费观看在线视频| 俄罗斯精品bbw| 久久人人爽人人爽人人片av高请 | 91在线|欧美| 欧美成人四级剧情在线播放| 夜夜夜夜猛噜噜噜噜噜试看| 四虎影视紧急入口地址大全| 亚洲av无码国产综合专区| 97大香伊在人人线色| 精品久久久久久中文字幕大豆网| 日韩一级片在线观看| 国产精品午夜福利在线观看地址| 偷天宝鉴在线观看国语| 一级欧美一级日韩| 色综合久久一区二区三区| 最近2018中文字幕2019国语视频 | 国产chinese91在线| 久久精品国产99国产精品亚洲 | 美女被免费看视频网站| 日本三级在线视频| 国产在线无码精品电影网| 亚洲一区二区三区免费在线观看| 中文字幕第3页| 日韩精品在线一区二区| 国产精品久久久久久久久久免费| 亚洲aⅴ男人的天堂在线观看| 国产精选之刘婷野战| 极品性放荡的校花小说| 国产精品福利一区二区久久| 亚洲精品无码久久毛片| 99这里只有精品66视频| 狠狠色狠狠色综合网| 好妈妈5韩国电影高清中字| 亚洲自国产拍揄拍| 99精品国产高清一区二区 | 扒开双腿猛进入免费观看美女| 又粗又硬又黄又爽的免费视频| jizz老师喷水| 狠狠色狠狠色综合日日五| 国产精品麻豆免费版| 亚洲日韩国产精品无码av|