橘子百科-橘子都知道橘子百科-橘子都知道

本初是谁

本初是谁 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微(wēi)软公司创始人(rén)比尔·盖茨已(yǐ)多次公开谈论人工(gōng)智能话题。在(zài)最近的一次采(cǎi)访中,他再次表示:“AI可能(néng)会让科技(jì)行业迎来(lái)一次剧烈的洗牌”。

这个结论(lùn)是(shì)他(tā)在当地(dì)时间(jiān)2月20日(rì)接(jiē)受(shòu)《In Good Company》节目专访时(shí)提出的。

他预期,AI的发展可能会威胁(xié)到谷歌的市占率,因为(wèi)微软(ruǎn)在AI方面的行动相当迅速。而(ér)最终科技(jì)巨(jù)头将(jiāng)把AI整合成用户的(de)“全能助手”,包(bāo)揽一切应用,与人们进行沟通并提供(gōng)建议,可以取代(dài)亚马逊、Siri或Outlook等应用。

大(dà)佬口中全能助手(shǒu)的到(dào)来可(kě)能尚需时日,但(dàn)由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话题热(rè)点(diǎn)包围(wéi)中杀出重(zhòng)围。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代表的AIGC上一次(cì)爆火的时候,还(hái)是2022年8月,在美国科罗拉多州(zhōu)举办的新兴(xīng)数字艺(yì)术家竞赛(sài)中(zhōng),一幅名(míng)为《太空歌剧院(yuàn)》的作品获奖。

随后各大厂商的(de)AI绘画软件(jiàn)被广(guǎng)大网友熟(shú)知并(bìng)体验,Stable Diffusion便是(shì)其(qí)中代表。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进(jìn)入(rù)可控期,将(jiāng)洗牌(pái)科技行(xíng)业(yè)?_黑料正能量

用户们可(kě)以在应用中输入一组关键词或者一(yī)张(zhāng)照片,就(jiù)能获(huò)得一幅AI创作的画作(zuò)。

作画的关键(jiàn)就是所输(shū)入(rù)的文本(běn)。同一(yī)组关(guān)键词也可以创(chuàng)作出很(hěn)多(duō)张风格不(bù)一(yī)样的(de)画作,这让(ràng)创作的过程就像开盲盒。

很多用户很喜欢这种不确定的惊喜,他们会将生成的美图当做头像。而另一(yī)部分(fēn)喜欢翻看AI绘画(huà)的“翻车”作品。在社交媒(méi)体上,许多用户分享AI“翻车现场”,例如,一位网友的小狗照片(piàn)被AI画成了(le)“肌肉男”,还有网友的个人(rén)照片被AI识(shí)别成了(le)建(jiàn)筑。

而(ér)如今随着ControlNet的(de)出现与加持(chí),以往AI绘画的填写关键(jiàn)词游戏可能要被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业(yè)?_黑料正能(néng)量

ControlNet是一(yī)位(wèi)正在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的(de)一种基(jī)于控制点的图像变(biàn)形算法,主要用于数字图像处(chù)理、计算机视觉和计算机图形(xíng)学等领(lǐng)域。

其SD插件(jiàn)一(yī)经发布,在短短的两天内便成为了AI绘(huì)画领域最新的热点。

在此之前,大家用了很多方法想让(ràng)AI生成的结(jié)果尽可能(néng)的符合要求,但是都不尽(jǐn)如人意,它的出现代表着AI生成开始进入(rù)真(zhēn)正(zhèng)的可控时期。

因为ControlNet可以直接提取(qǔ)画面(miàn)的构图,人物的姿势和画面(miàn)的深(shēn)度信息等(děng)。有(yǒu)了它(tā)的帮助,就不用频繁的用(yòng)提(tí)示词来(lái)碰运(yùn)气,抽盲盒式的创作(zuò)了。

通(tōng)俗的说(shuō)ControlNet相当于给(gěi)AI绘画加了“魔法”,不少博主的作品已经获得了(le)大(dà)量的浏览量,“viggo”就是其中之一,他(tā)用(yòng)朋友(yǒu)的照片直(zhí)接(jiē)带她们(men)走进(jìn)动漫世界。

ChatGPT之(zhī)后又一应(yīng)用(yòng)杀疯了(le),AIGC或进入可控期(qī),将(jiāng)洗牌科技(jì)行业?_黑料正(zhèng)能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓(tuò)展找到(dào)对应的关(guān)键词(cí);最后(hòu)用ControlNet插件绑定骨骼开始(shǐ)换(huàn)关键词试效果。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控(kòng)期,将(jiāng)洗牌科技行(xíng)业(yè)?_黑(hēi)料正能量

通过图片就可以看出来,效果十分惊(jīng)艳(yàn)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料正(zhèng)能(néng)量

ChatGPT之后又一(yī)应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科(kē)技(jì)行业?_黑(hēi)料正能量

更厉害的(de)是(shì),除了真(zhēn)实的照片(piàn),草(cǎo)图(tú)也可以加上“魔法”,知乎大牛“DevPoint”和“逗砂(shā)”介绍到(dào)ControlNet还能(néng)实现(xiàn)线稿转全彩图(tú)。大神张吕(lǚ)敏其本尊也亲自(zì)回(huí)应(yīng)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正(zhèng)能(néng)量

不(bù)得(dé)不(bù)说当(dāng)下AIGC已经变得越来越(yuè)强大,甚至输出的(de)作品都已经能以假乱真了。

02

难辨(biàn)虚实(shí),AIGC技术力爆(bào)发

警惕安全问题

近日(rì),“苏州金鸡湖有(yǒu)游艇(tǐng)party”的消息火遍(biàn)网络,而经过警方辟谣(yáo)这所谓(wèi)的“party”可能是全国第(dì)一起(qǐ)AI绘图诈(zhà)骗。

由于这个活(huó)动里面给出(chū)的美(měi)女照片都是AI制作的(de)真(zhēn)人(rén)照(zhào)片绘图,因(yīn)为(wèi)太逼真,被大家当成真事传(chuán)播了

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科技行业?_黑料(liào)正能量

不过仔细观察可以发现,活动发起者提供的照片中有个很大的漏洞(dòng)可以发现并非真人,而是AI绘(huì)图,那便是图(tú)片(piàn)中(zhōng)女(nǚ)性的手(shǒu)指(zhǐ)部分有的存在异常。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

有行业人事表示:“现在因(yīn)为手指(zhǐ)部分的绘画算法(fǎ)比较复杂,AI还不太会(huì)画人(rén)的手,但(dàn)最新(xīn)看到(dào)的图片已经有(yǒu)越来越完美的AI模型(xíng)出现(xiàn),以后(hòu)可能就完(wán)全(quán)没有漏洞了。

类似的AI作图诈骗在国外也已有(yǒu)发生。据英国广(guǎng)播(bō)公司(sī)报道(dào),土耳其(qí)地(dì)震期间,有Tiktok用户使用(yòng)AI合成了(le)儿童受灾的假照片发布到网(wǎng)络,以(yǐ)此诱骗(piàn)善良的(de)人打(dǎ)赏“捐助(zhù)”从而(ér)实(shí)施诈骗。

目前随着(zhe)技术发展(zhǎn),AIGC已经能(néng)做出真人(rén)照片般(bān)的绘(huì)图效果(guǒ),如果这(zhè)样的(de)图片被用来(lái)诈骗,将非常可(kě)怕。

此外AIGC还(hái)引发了很多担忧(yōu),一方面,批判者认为AI在“学习(xí)”了大(dà)量前人的作品(pǐn)之后(hòu),其创作没有任(rèn)何(hé)情绪和灵魂,难以和人类的(de)艺术创作相提并(bìng)论。

另一方面,AIGC背后(hòu)的版权、目(mù)前都(dōu)并(bìng)没有得到有效的解决,还(hái)有AIGC会不(bù)会(huì)代替人类“至高无上”的创意。

马斯克也(yě)强调,人工智能的安全问题需(xū)要得到重视,太晚(wǎn)就来(lái)不及了(le)。

03

AIGC下一站除了视频,还有远方

技术(shù)都是(shì)有两面性(xìng)的(de),潜在的危害并(bìng)不能(néng)掩(yǎn)盖其光辉的贡献(xiàn)。现在看来,人工智能技(jì)术(shù)将(jiāng)是第四次工业革命的(de)核心驱动力量(liàng),将创造新(xīn)的增长奇迹。

过去一年,人工智能(néng)在技术和(hé)商(shāng)业层面都有(yǒu)了(le)巨大进展(zhǎn),AI绘画(huà)就(jiù)是人(rén)工智能技术(shù)发生方向性(xìng)改变的一个代表(biǎo)。其下一(yī)站或(huò)许就是(shì)视频。

此前,Meta和谷歌先后(hòu)发(fā)布了几条引爆科技圈的短视频。这些(xiē)视频(pín)引(yǐn)发关(guān)注并非内容做得多优秀,反而都非常简单,比如一匹正在喝水的马,一只画画的(de)玩具(jù)熊,或(huò)者一段骑摩托车的第一视(shì)角(jiǎo)录像,随便一个有手机的人都可以随手录下一(yī)段。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入(rù)可控(kòng)期,将洗牌(pái)科(kē)技行业?_黑料正(zhèng)能(néng)量

但这些(xiē)短视频的创作方式(shì)非(fēi)常简单,创作(zuò)者仅仅需要向AI输入一(yī)段话,甚至只是说一下要求,AI就(jiù)可以根(gēn)据需要生成(chéng)一段视频(pín)。

谷歌发布的两个AI生成(chéng)视频(pín)分别(bié)来自(zì)于Imagen Video和Phenaki,前者(zhě)主要突出的是高清,与Meta的(de)Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布了(le)AI生成的(de)视(shì)频后,AI圈就已经(jīng)玩了一波梗,一个能够做出更高(gāo)清视频的AI还不足以在短时间(jiān)内戳中(zhōng)兴奋点。

Phenaki更加(jiā)令(lìng)人震(zhèn)惊的(de)地方在于,它可(kě)以制作出超过2分(fēn)钟的(de)连贯的也(yě)有确切(qiè)内容的视频,这才(cái)是真(zhēn)正让人(rén)们感(gǎn)到惊喜的(de)地(dì)方。因为(wèi)无(wú)论AI生(shēng)成的视(shì)频多么(me)高清,也只能是为内容生产(chǎn)者提供一(yī)个灵感,一个素材(cái),一个过场动画。

不过能够制作(zuò)出有具体剧情(qíng)内容的(de)视频就意味着,一(yī)些视频(pín)创作(zuò)由AI代替人工完成(chéng)已经(jīng)初步有了可(kě)能。

当下(xià)AI的发展速度已(yǐ)经超过大部分人的想象。内容产业的(de)本(běn)质是供(gōng)给(gěi)创造需求,AIGC作为全新的内容生产(chǎn)方式,可以为内容产业带来更新的内容(róng)风格、更快的生(shēng)产速(sù)度(dù),更低的生产(chǎn)成本,这无疑会驱动内容产业的大爆发。

除了AI绘图、视频,AIGC技术还能应用于音乐(lè)、代码、机器人动作(zuò)等(děng)多(duō)种内容形式的生(shēng)成。不难发(fā)现该项技术不仅在游戏等行业(yè)能得(dé)到有(yǒu)效(xiào)应用,对(duì)于下一代(dài)互联(lián)网各种元素的构(gòu)建亦有关键(jiàn)意义。

从商业化的角度来看,文(wén)化娱乐、教育、传媒等诸多领域(yù),本身就对基(jī)于(yú)AI的可视(shì)化内容有强(qiáng)烈需(xū)求。

因此,AI绘(huì)画及视频或不是结(jié)果,而只是AI进程中的一(yī)块重要拼(pīn)图,有望(wàng)在(zài)技术更新(xīn)的(de)加持下实现更(gèng)大(dà)的应用(yòng)价值。

AI从理(lǐ)解(jiě)内容,走向(xiàng)了可以(yǐ)生(shēng)成(chéng)内容,甚至能够创(chuàng)造出(chū)独立价值(zhí)和独立视角的内(nèi)容(róng)。AIGC的再次出圈,更(gèng)代表着未来的(de)先(xiān)进生产(chǎn)力即将(jiāng)到(dào)来。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑料正能量

04

紧抓大模型与算力,牢(láo)固AIGC底座

从(cóng)技术的发展也可以看出,在语言大模(mó)型、图像大(dà)模型之后,多模态大模型已经成为了新的趋(qū)势。

大(dà)模型被誉为当前人(rén)工智能发展的智能底(dǐ)座(zuò),是全(quán)球竞争(zhēng)最(zuì)激烈的研究方向之一,包(bāo)括谷歌、亚马逊、百度(dù)、阿(ā)里、腾讯等(děng)众多头部企业都(本初是谁dōu)在竞(jìng)相发力。

不过(guò)训练大模型的确(què)价格不菲,以(yǐ)国盛(shèng)证券(quàn)发布的《ChatGPT需要(yào)多少算力》报告(gào)估算,GPT-3训(xùn)练一次(cì)的成本约(yuē)为140万美元。而对于(yú)一些(xiē)更大(dà)的(de)LLM(大型语(yǔ)言模型),训(xùn)练(liàn)成本则介于200万美元至(zhì)1200万美(měi)元(yuán)高(gāo)价之间。

以ChatGPT在2023年1月的独立访(fǎng)客平(píng)均数1300万计(jì)算,其对应芯(xīn)片需求为3万多片英伟达A100 GPU,初始(shǐ)投入成本约为8亿美元,每日仅(jǐn)电费就在5万美元左右。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

此外不(bù)论是(shì)ChatGPT还是AIGC,都离不开庞大(dà)算力(lì)支持。在关注各类大模型的发(fā)展同时,更应该(gāi)关注算力网络的建设。

算力网络正驱动AI产(chǎn)业发展进入史诗级(jí)加速进程,让AIGC及通用AI这(zhè)一人工智(zhì)能发展(zhǎn)的终极(jí)目(mù)标离得更近。

因为算力可以对突破(pò)性技术(shù)创(chuàng)新提供(gōng)大(dà)力的(de)支(zhī)持(chí)。这方面,多模(mó)态大模型是典型。作为面向未来强人(rén)工智能、通用(yòng)人(rén)工智能的重要技术创新,多模态大模型已经在(zài)人(rén)工智能(néng)领域提(tí)出了很(hěn)多年(nián),业界也有(yǒu)不少技术突破,但是(shì),多模态大模型进一步(bù)往下走,算力需(xū)求呈几(jǐ)何式上升(shēng),一般(bān)的算力基础设施很快将难以胜(shèng)任(rèn)。

从图像、文字、语音(yīn)单独(dú)一项的训练(liàn),到双(shuāng)模态、三模态的跃迁,让人(rén)工智能可以灵(líng)活应对不同模态的转化、像人与世界交互一样自(zì)然,这方面(miàn),由算力(lì)网络来驱动将有明显(xiǎn)优(yōu)势。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进(jìn)入可(kě)控期(qī),将洗牌科技行业?_黑料正能量

此外(wài),还有很多需要爆(bào)发式(shì)增长的算力来支撑的技术创新,将在人工(gōng)智能算力网络(luò)支(zhī)撑下(xià)快(kuài)速推(tuī)进。

AIGC已经露出(chū)曙光,期待在大模型和(hé)大(dà)算力的支持下AIGC能持续颠覆内容生产(chǎn)的方(fāng)式,将创造的边际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 本初是谁

评论

5+2=