自(zì)聊天机器人ChatGPT火(huǒ)爆以(yǐ)来,微软公司创始人比尔·盖茨已多次公开谈论人工(gōng)智能话题。在最(zuì)近(jìn)的一次采访中,他再次表示:“AI可(kě)能会让科技行业(yè)迎来一次剧烈的洗牌”。
这个(gè)结论是(shì)他(tā)在当地时间2月20日接(jiē)受《In Good Company》节目专访时(shí)提出的。
他预期,AI的发展可(kě)能会威(wēi)胁到谷歌的市占(zhàn)率,因为微软(ruǎn)在(zài)AI方面(miàn)的行动相(xiāng)当(dāng)迅速。而(ér)最(zuì)终科技巨(jù)头(tóu)将把AI整合(hé)成用户(hù)的“全能助手(shǒu)”,包揽一切应(yīng)用,与(yǔ)人们进行(xíng)沟通并提供建议,可以取(qǔ)代(dài)亚马逊、Siri或(huò)Outlook等应用(yòng)。
大佬(lǎo)口中(zhōng)全能助手的到来可能尚需时日,但由(yóu)ControlNet引发(fā)的又一次AI绘画浪潮(cháo),让AIGC在ChatGPT的话题热点包围中杀(shā)出重围。
01
ControlNet颠覆AI绘画(huà)新玩法
AIGC向可控靠近
以AI绘画为代(dài)表的AIGC上一次爆火的时候,还是2022年8月,在美国科(kē)罗拉多州举办的新兴数(shù)字艺术(shù)家竞赛中(zhōng),一幅名为《太空歌剧院》的作品(pǐn)获(huò)奖。
随后各大厂(chǎng)商(shāng)的AI绘画软件被广大网友熟知(zhī)并体验,Stable Diffusion便是其中代表(biǎo)。
用户(hù)们可以(yǐ)在(zài)应用中输入一组关键词(cí)或者一张(zhāng)照片,就能获得(dé)一幅AI创(chuàng)作的画作。
作画的关键就(jiù)是所输入的文本(běn)。同(tóng)一组关键词也可以创作(zuò)出很多张(zhāng)风格不一样的画作(zuò),这让创作的过程就像开盲盒(hé)。
很(hěn)多用户很喜欢这种不确定的惊(jīng)喜,他们会将生成的(de)美图当做头像(xiàng)。而(ér)另一部分喜欢翻看AI绘画(huà)的(de)“翻车(chē)”作品。在社交媒(méi)体上,许(xǔ)多用户(hù)分享AI“翻车现场”,例如,一位网友的(de)小狗照片被AI画(huà)成了“肌肉男”,还有网友的个人照(zhào)片被AI识别成了建(jiàn)筑。
而如今随(suí)着ControlNet的出现与加持,以往AI绘画(huà)的填(tián)写关键词游戏可能要(yào)被颠覆了(le)。
ControlNet是一位正在斯坦福(fú)读博的中国(guó)人张吕敏创作的一种(zhǒng)基(jī)于控制点的图像变形算法,主(zhǔ)要用于数字图像处理、计算(suàn)机(jī)视(shì)觉和计算机图形学等领域(yù)。
其SD插件(jiàn)一经发布,在短短的两天内便成为了(le)AI绘画(huà)领域最(zuì)新(xīn)的热(rè)点。
在此(cǐ)之前,大家用了很多方法想让AI生成的结(jié)果尽可能(néng)的符合要求,但是都不(bù)尽如人意,它(tā)的出(chū)现代表着AI生(shēng)成开始(shǐ)进入真(zhēn)正的可(kě)控时期。
因为ControlNet可以直接提取画面的构图,人物(wù)的姿势和画面的深度信息等。有了它的帮助,就(jiù)不(bù)用(yòng)频繁(fán)的用提示词来碰运(yùn)气,抽盲盒式(shì)的创作了(le)。
通俗的说ControlNet相当于给AI绘画加了“魔(mó)法(fǎ)”,不少博主的作品已经(jīng)获得了大量(liàng)的浏(liú)览量(liàng),“viggo”就(jiù)是其中之一,他用朋(péng)友(yǒu)的(de)照片直接带她们走(zǒu)进动漫世界。
viggo先(xiān)用StableDiffusion图片转文(wén)字(zì)。
再(zài)用Text2Prompt插件拓展找到对应的关键(jiàn)词;最(zuì)后(hòu)用ControlNet插(chā)件绑定(dìng)骨骼开(kāi)始(shǐ)换(huàn)关键词试效果。
通过图片(piàn)就可以看出来,效(xiào)果十分惊艳。
更厉害(hài)的是,除了真(zhēn)实的照(zhào)片,草(cǎo)图(tú)也可以加上(shàng)“魔法”,知乎(hū)大(dà)牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还(hái)能实现线稿转全(quán)彩图。大神张吕敏其本尊也(yě)亲自(zì)回应。
不(bù)得不(bù)说当下AIGC已经变得越(yuè)来(lái)越(yuè)强(qiáng)大,甚至输出的作品都已经能(néng)以(yǐ)假乱真了。
02
难辨虚实(shí),AIGC技术力爆发
警惕安全问题(tí)
近日,“苏州(zhōu)金鸡(jī)湖有(yǒu)游(yóu)艇party”的消息(xī)火遍(biàn)网络,而经过警方辟(pì)谣这所(suǒ)谓的“party”可能是全国第一(yī)起AI绘图诈(zhà)骗(piàn)。
由于(yú)这个(gè)活(huó)动(dòng)里面(miàn)给出的美女(nǚ)照片(piàn)都是AI制(zhì)作(zuò)的真(zhēn)人照(zhào)片绘图,因为太逼真,被大(dà)家(jiā)当成(chéng)真事传播了。
不过仔细观察(chá)可(kě)以发(fā)现(xiàn),活动发起者提供(gōng)的照片中有(yǒu)个很大(dà)的(de)漏洞可以发现并(bìng)非(fēi)真人(rén),而是(shì)AI绘图,那便是图(tú)片中女(nǚ)性的(de)手指部(bù)分有的存在异常。
有行业人事表示:“现在因为手指部分的绘画算法比较复杂,AI还(hái)不(bù)太会画人(rén)的手,但最新看到(dào)的图片(piàn)已经有越来(lái)越完美的(de)AI模型出现,以后可能就(jiù)完全没(méi)有漏洞了。”
类似(shì)的AI作图诈骗在国外(wài)也已有(yǒu)发生。据英国(guó)广(guǎng)播公司报道,土耳(ěr)其地震期(qī)间,有Tiktok用户使用AI合成了(le)儿童受灾的假照片(piàn)发布(bù)到网络(luò),以此诱骗善良的人打赏(shǎng)“捐助”从而(ér)实施诈骗。
目前随着技术发展,AIGC已经能做出(chū)真人照(zhào)片般的(de)绘图效果,如果这样的图片(piàn)被(bèi)用(yòng)来诈(zhà)骗,将(jiāng)非(fēi)常可怕。
此外AIGC还引发了很多担忧(yōu),一方面,批判(pàn)者认为AI在“学习”了(le)大(dà)量前人的作品之后(hòu),其创作没有任何情绪和灵魂,难以和(hé)人类的艺术创作相提并论。
另一方面,AIGC背后(hòu)的版权、目前都并没有得(dé)到有效(xiào)的解(jiě)决,还有AIGC会不会代(dài)替人类“至高无上”的(de)创意。
马斯克(kè)也(yě)强(qiáng)调,人工智(zhì)能的安全问题需要得到重视(shì),太晚就来不(bù)及了。
03
AIGC下一站除(chú)了(le)视频,还有(yǒu)远方
技术都是(shì)有两面性(xìng)的,潜在的危害并不(bù)能(néng)掩盖(gài)其光(guāng)辉的贡献。现在看来,人工智(zhì)能技(jì)术将是第四次工业革命的核心驱动力(lì)量,将创(chuàng)造新(xīn)的增长(zhǎng)奇迹。
过去一年,人工智能(néng)在技术和商业层(céng)面都有了(le)巨大进展,AI绘画就是人工智能(néng)技术发生方(fāng)向性改变的(de)一个代表(biǎo)。其下一(yī)站或许就是视频。
此前,Meta和谷歌(gē)先(xiān)后发布(bù)了几条引(yǐn)爆科技(jì)圈(quān)的(de)短视频。这些视频引发(fā)关注并非内容做得多优(yōu)秀,反而都非常简单(dān),比如一匹正在喝水(shuǐ)的马,一只画画的(de)玩具(jù)熊,或者一段骑摩(mó)托车的第一视角录像,随便一个(gè)有手(shǒu)机的人都可(kě)以(yǐ)随手(shǒu)录(lù)下一段。
但(dàn)这(zhè)些(xiē)短(duǎn)视频的创(chuàng)作方式非常(cháng)简单,创作者(zhě)仅(jǐn)仅需要向(xiàng)AI输(shū)入一段话(huà),甚至(zhì)只是说(shuō)一(yī)下要求,AI就可(kě)以根据需要生成一(yī)段视频。
谷歌发布的两个AI生成视频(pín)分别(bié)来(lái)自于Imagen Video和(hé)Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有(yǒu)太(tài)多的差别。
在Make-A-Video公(gōng)布了(le)AI生成的视频后,AI圈就已经玩了一(yī)波梗,一(yī)个能够(gòu)做(zuò)出更高清视频的AI还不足以(yǐ)在短时间内戳中兴奋点。
Phenaki更(gèng)加(jiā)令人(rén)震惊的(de)地方在于,它可以制作(zuò)出超(chāo)过2分钟的连贯(guàn)的也(yě)有(yǒu)确切内容的视频,这才是真正(zhèng)让人们感(gǎn)到(dào)惊喜的地方(fāng)。因为(wèi)无论AI生成的视频多么高清,也只能(néng)是为(wèi)内容(róng)生产者提(tí)供一(yī)个灵感(gǎn),一个(gè)素材,一(yī)个过(guò)场动画。
不过能够制(zhì)作出有(yǒu)具体剧情内容的视(shì)频就意味着,一些视频(pín)创作由AI代(dài)替人工(gōng)完成已经(jīng)初步有了可能。
当(dāng)下AI的发展速度已(yǐ)经超过大部分人的想象。内容(róng)产(chǎn)业的(de)本质是供给创造需求,AIGC作(zuò)为全新的(de)内容生产方式,可以(yǐ)为内(nèi)容产业带来更新的内(nèi)容(róng)风格、更快的生产(chǎn)速度(dù),更低(dī)的(de)生产成(chéng)本(běn),这无(wú)疑会(huì)驱(qū)动内容产业的大爆(bào)发。
除(chú)了(le)AI绘图(tú)、视频,AIGC技术还能应用(yòng)于音乐、代(dài)码、机器人动(dòng)作等多种内容形式的(de)生成。不难发现该项技术不仅(jǐn)在游(yóu)戏等行业能得(dé)到有(yǒu)效应用,对于(yú)下一代互联网各种元素(sù)的构建亦有关键意义。
从(cóng)商业化的角度来(lái)看,文化(huà)娱乐、教育、传媒等(děng)诸多(duō)领域,本(běn)身就对基于AI的(de)可视化内容有强(qiáng)烈需求。
因此,AI绘(huì)画及(jí)视(shì)频或不是结果,而只是AI进程中的一块(kuài)重要拼图,有望在技术更(gèng)新的加持下实现更大的应用价值。
AI从理解内(nèi)容,走向了可以(yǐ)生成内容,甚(shèn)至能够(gòu)创造(zào)出独立价值和独立视角的内容(róng)。AIGC的再次出圈(quān),更代表着未(wèi)来的(de)先进(jìn)生产力即将到来。
04
紧抓大模型与算力,牢固AIGC底(dǐ)座
从技术的发展也(yě)可以看出,在(zài)语(yǔ)言(yán)大模型、图像(xiàng)大模型之后,多模态大模型已经成为了(le)新的趋势。
大模型被誉为当(dāng)前人工智能发展的智能(néng)底(dǐ)座(zuò),是全球(qiú)竞争最激烈的研究方向(xiàng)之(zhī)一,包括(kuò)谷歌、亚马逊(xùn)、百度(dù)、阿里、腾讯等众(zhòng)多头部(bù)企业都在竞(jìng)相发(fā)力(lì)。
不过训练大模型的(de)确价格不菲,以国盛证券发布的(de)《ChatGPT需要多少算(suàn)力》报告估算,GPT-3训(xùn)练一次的成本约为140万(wàn)美(měi)元。而对于一些更大的LLM(大(dà)型语言(yán)模型),训练成(chéng)本则介于200万美元至1200万美元(yuán)高价之(zhī)间。
以ChatGPT在2023年1月的独立访客平均(jūn)数1300万计算,其对应芯片需求为(wèi)3万多(duō)片英伟达A100 GPU,初始(shǐ)投(tóu)入成(chéng)本约为8亿美元,每日(rì)仅电费就在(zài)5万美元左右。
此外不(bù)论是ChatGPT还是AIGC,都离不开庞大算力支持。在关注(zhù)各(gè)类(lèi)大模型(xíng)的发展同时,更应该关(guān)注算力网(wǎng)络(luò)的(de)建设。
算力网络正驱动(dòng)AI产业发展进(jìn)入史诗级加(jiā)速(sù)进程,让AIGC及(jí)通用(yòng)AI这一人工智能发展(zhǎn)的终极目标离(lí)得更近。
因(yīn)为算力可以对突(tū)破性技(jì)术创新(xīn)提供大(dà)力的支持。这(zhè)方(fāng)面,多模态大(dà)模型是典型。作为面(miàn)向未来(lái)强人工智能、通(tōng)用人工智能的重要技术创新,多模态大模(mó)型已(yǐ)经在人工智能领域提出了很多年,业界也有不(bù)少(shǎo)技术突破,但是,多(duō)模态大模型进一步往下走,算力(lì)需求(qiú)呈几(jǐ)何式(shì)上升,一般的算(suàn)力基础设(shè)施很(hěn)快将难以胜任(rèn)。
从图像、文字(zì)、语音单(dān)独一项的训练,到双模态(tài)、三(sān)模态的跃迁,让人工智能可以灵活应对不同模态的转化(huà)、像人与(yǔ)世界交互一样自然,这(zhè)方面,由算力网(wǎng)络来驱动将(jiāng)有明(míng)显优势。
此外,还有很多需要爆发式增长的算力来支撑的技术创新,将在人工智能算力网络支(zhī)撑下快速推进。
AIGC已(yǐ)经露出曙(shǔ)光(guāng),期待(dài)在大模型(xíng)和大(dà)算(suàn)力的支持下AIGC能持(chí)续颠覆内容生产(chǎn)的方(fāng)式,将创造的边际成本降低,让万(wàn)众受益。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了