
文章圖片

文章圖片
《深度合成十大趨勢報(bào)告(2022)》發(fā)布 , 其中談到:“趨勢四:深度合成領(lǐng)域開源項(xiàng)目數(shù)與討論度持續(xù)攀升” 。
2017年 , 名為“Deepfakes”的用戶利用深度合成技術(shù)制作的成人視頻在Reddit社區(qū)中瘋狂傳播 , 迫于公眾輿論壓力 , Reddit網(wǎng)站將該用戶封號 。
該用戶隨即在全球最大的代碼開源平臺GitHub上公開了實(shí)現(xiàn)該技術(shù)的源代碼 , 瞬時(shí)引發(fā)了技術(shù)愛好者的廣泛關(guān)注與討論 。 此后 , 開發(fā)者們不斷創(chuàng)造和豐富更多的深度合成相關(guān)技術(shù)的項(xiàng)目與代碼 , 以“GAN”、“NeRF”、“TTS”等關(guān)鍵詞進(jìn)行檢索后發(fā)現(xiàn) , 2017年以來的深度合成領(lǐng)域的項(xiàng)目數(shù)量顯著增長 。
在這些開源項(xiàng)目中 , 也涌現(xiàn)出了一些很有代表性的方法 , 這些方法受到越來越多的關(guān)注 , 也被應(yīng)用在了不同的場景之中 。
如faceswap項(xiàng)目 , 可實(shí)現(xiàn)識別和交換視頻中的人臉的功能 , 自2018年初開源 , 曾一度登上GitHub排行榜第二位 , 目前已獲得超過4萬的關(guān)注量 。
基于這些開源方法 , 更多的技術(shù)愛好者持續(xù)討論并且做出補(bǔ)充和貢獻(xiàn) , 共同促進(jìn)深度合成方法在合成質(zhì)量、制作效率等方面不斷升級和迭代 。
以圖像方向、音頻方向、文本方向中具有代表性的5個(gè)開源項(xiàng)目為例 , 其Star數(shù)量在2021年均已突破1萬(GitHub中Star數(shù)超過1萬的項(xiàng)目占總項(xiàng)目數(shù)的比例低于百萬分之九) 。
其中 , DeepFaceLab、first-order-model、stylegan、Real-Time-Voice-Cloning、gpt-2項(xiàng)目可分別實(shí)現(xiàn)面部替換、動(dòng)作或表情操縱、人臉等圖像生成、聲音復(fù)刻、文本生成的功能 。
【清華大學(xué)|清華大學(xué)人工智能研究院:人工智能換臉開源項(xiàng)目數(shù)量,持續(xù)攀升】四種深度合成形式在目前都存在一定局限 , 比如人臉替換需要對源圖像和目標(biāo)圖像進(jìn)行多角度的面部特征數(shù)據(jù)訓(xùn) , 面部表情操控實(shí)現(xiàn)的前提是目標(biāo)人物面部直對鏡頭 , 并且能保持一段時(shí)間 , 想要變換人臉角度就要更多的數(shù)據(jù) , 更多的訓(xùn)練 。 而且 , 自然融入運(yùn)行的視頻之中的語音 , 用語音合成技術(shù)也較為困難 , 都需要很多技術(shù)和人力的投入 。
《深度合成十大趨勢報(bào)告(2022)》由清華大學(xué)人工智能研究院、北京瑞萊智慧科技有限公司、清華大學(xué)智媒研究中心、國家工業(yè)信息安全發(fā)展研究中心、北京市大數(shù)據(jù)中心近日聯(lián)合發(fā)布 。
(完)
出品人 , 親愛的數(shù)據(jù)
相關(guān)經(jīng)驗(yàn)推薦
- 等離子體|谷歌人工智能團(tuán)隊(duì)的最新成果: 控制聚變反應(yīng)堆
- 深度學(xué)習(xí)|“一日通”、“人工智能”到底是什么鬼?
- 機(jī)器人|戰(zhàn)爭領(lǐng)域的第三次革命 人工智能是否變得比核武器更危險(xiǎn)?
- |制勝的關(guān)鍵。誰在人工智能領(lǐng)域贏得比賽?
- 武漢|我市公開征集人工智能示范應(yīng)用場景
- |美國人工智能系統(tǒng)曝光,實(shí)力驚人,1小時(shí)能找出對手50座導(dǎo)彈基地
- 硅谷|華裔科學(xué)家流失!硅谷喪失人工智能優(yōu)勢,白宮反思不該歧視黃種人
- 率土之濱|率土之濱:萌新玩家大戰(zhàn)人工智能,董卓被打得一臉懵逼
- |頂級AI專家警告:人工智能可能有了輕微自主意識
- 自動(dòng)駕駛|對于人工智能的淺談,見識;明天會更好
