• <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
  • <s id="gswm4"><em id="gswm4"></em></s>
    • <s id="gswm4"><em id="gswm4"></em></s>
      首頁 > 國際 >

      上海人工智能實驗室發布多模態語料


      (資料圖片僅供參考)

      原標題:上海人工智能實驗室發布多模態語料

      人民日報上海8月15日電 (記者沈文敏)近日,上海人工智能實驗室宣布聯合語料數據聯盟成員單位,共同開源發布“書生·萬卷”1.0多模態預訓練語料。

      “書生·萬卷”1.0集合了語料數據聯盟成員豐富的內容積累與上海人工智能實驗室的數據處理能力等優勢,將為學術界及產業界提供高質量大模型多模態預訓練語料。本次開源的數據總量超過2TB,具備多元融合、精細處理、價值對齊、易用高效等四大特征。

      本次開源的“書生·萬卷”1.0包含文本、圖文、視頻三部分數據集。其中文本數據來自網頁、百科、書籍、專利、教材、考題等,數據總量超過5億個文檔,數據大小超過1TB,覆蓋科技、文學、媒體、教育、法律等多個領域;圖文數據主要來自公開網頁,經處理后形成圖文交錯文檔,總量超過2200萬個,數據大小超過140GB(不含圖片),覆蓋新聞事件、人物、自然景觀、社會生活等多個領域;視頻數據主要來自中央廣播電視總臺和上海文廣集團,包含新聞、影視等多種類型的節目影像,總計視頻文件數超過1000個,數據大小超過900GB,內容覆蓋軍事、文藝、體育、自然、知識、影像藝術等方面。

      關鍵詞:

      責任編輯:Rex_16

      推薦閱讀
      91亚洲精品色午夜麻豆,91美女在线视频,性欧美tube精品,久久99精品久久久久久野外
    • <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
    • <s id="gswm4"><em id="gswm4"></em></s>
      • <s id="gswm4"><em id="gswm4"></em></s>
        主站蜘蛛池模板: 精品中文字幕乱码一区二区| 亚洲一区爱区精品无码| 久久午夜免费鲁丝片| 99热精品久久只有精品| 青青青视频免费| 日韩在线第一区| 国产综合久久久久| 吃奶摸下高潮60分钟免费视频| 亚洲国产激情一区二区三区| 一区精品麻豆入口| 黄色a视频在线观看| 晓雪老师下面好紧好湿| 国产精品视频yuojizz| 亚洲欧洲日韩国产一区二区三区 | 国产91最新在线| 亚洲人成7777影视在线观看| 中文字幕日韩wm二在线看| 最近中文字幕免费mv视频| 国产成人亚洲综合无| 亚洲乱码一区二区三区在线观看| 2020国产精品自拍| 日韩欧美亚洲综合久久| 国产亚洲精品自在久久| 中文字幕在线观看网站| 精品人妻潮喷久久久又裸又黄 | 亚洲日本在线观看| 99精品国产一区二区三区不卡| 综合五月天婷婷丁香| 女人是男人未来1分50秒| 四虎影视免费永久在线观看| 久久国产精品最新一区| 国产h片在线观看| 欧洲精品无码一区二区三区在线播放 | 亚洲精品无码不卡| 337p欧洲大胆扒开图片| 日韩欧美亚洲天堂| 四虎免费永久在线播放| r18bl各种play高h| 精品一区二区三区av天堂| 国内揄拍国内精品视频| 亚洲一区二区三区免费视频|