橘子百科-橘子都知道橘子百科-橘子都知道

外国人吃米饭吗,外国人是不是不吃米饭

外国人吃米饭吗,外国人是不是不吃米饭 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火(huǒ)爆以来,微软公司创始人比(bǐ)尔(ěr)·盖茨已多次公开(kāi)谈论人(rén)工智能话(huà)题。在(zài)最近的一次采访中(zhōng),他再次表示(shì):“AI可能会让科技行业迎来(lái)一(yī)次剧烈的洗牌”。

这个结论是他在当地时间2月20日接受《In Good Company》节目专访时(shí)提出的。

他预期,AI的(de)发(fā)展可能(néng)会(huì)威胁到谷歌的市(shì)占率,因为微软在AI方(fāng)面的行动相当迅速。而最终科技(jì)巨头将(jiāng)把AI整合成用户的“全能(néng)助(zhù)手”,包揽一切应用,与人们进行沟通(tōng)并提供建议,可以取代亚马逊(xùn)、Siri或Outlook等(děng)应用(yòng)。

大佬口(kǒu)中(zhōng)全能助手的到来可能尚需时日,但(dàn)由ControlNet引(yǐn)发的又一次(cì)AI绘画浪(làng)潮,让AIGC在(zài)ChatGPT的话(huà)题(tí)热点(diǎn)包围中杀出重(zhòng)围(wéi)。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技行(xíng)业?_黑(hēi)料正能量

01

ControlNet颠(diān)覆AI绘画(huà)新(xīn)玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时候,还是2022年8月,在美国科罗拉多州(zhōu)举办的新兴数字艺术家竞赛中,一幅名为《太空歌剧(jù)院》的作品(pǐn)获奖(jiǎng)。

随后(hòu)各大厂商的AI绘画(huà)软件被广(guǎng)大网(wǎng)友熟(shú)知并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量

用户们可以在应用中输入一组关(guān)键(jiàn)词或者(zhě)一张照片,就能获得(dé)一幅(fú)AI创作(zuò)的画(huà)作(zuò)。

作画的关键就是所(suǒ)输入(rù)的文本。同一组关(guān)键(jiàn)词也(yě)可以(yǐ)创作出(chū)很多张风格不一样的画作,这让创作(zuò)的过程(chéng)就像(xiàng)开(kāi)盲(máng)盒(hé)。

很多用户(hù)很(hěn)喜欢这种不确(què)定的惊喜,他们(men)会将生成(chéng)的美图当做头(tóu)像。而另一部分喜欢翻看(kàn)AI绘画的“翻车”作品。在社交媒(méi)体上,许多用户分(fēn)享(xiǎng)AI“翻车现(xiàn)场”,例如(rú),一位网友的小狗照片被AI画成(chéng)了“肌肉男(nán)”,还有网友(yǒu)的个人照片被AI识别(bié)成(chéng)了建筑。

而如今随着ControlNet的(de)出现(xiàn)与加持,以往AI绘画的填(tián)写关键词游(yóu)戏可能要被(bèi)颠覆(fù)了。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量

ControlNet是一(yī)位正(zhèng)在斯坦福读博的中国(guó)人张吕敏创作的一种基于控制点的图像变形算法,主要用于数字图像处理(lǐ)、计(jì)算机视觉和计算(suàn)机图形学等领域。

其(qí)SD插(chā)件一经发布,在短(duǎn)短的两天内便成为了AI绘画领(lǐng)域(yù)最新的热(rè)点。

在(zài)此(cǐ)之前(qián),大家用了很多方法(fǎ)想让(ràng)AI生外国人吃米饭吗,外国人是不是不吃米饭成(chéng)的(de)结(jié)果尽可能(néng)的符合(hé)要求,但是都(dōu)不尽如人(rén)意,它的出现代表着AI生成开始进入真正的可(kě)控时(shí)期。

因为ControlNet可(kě)以直接提取画面(miàn)的构图,人物的姿势和画面的深度信息等(děng)。有了它的帮助,就不用频繁的用提(tí)示词来碰(pèng)运气(qì),抽盲盒式(shì)的(de)创(chuàng)作了。

通(tōng)俗的(de)说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品已经(jīng)获得了大量的(de)浏览量,“viggo”就是(shì)其中(zhōng)之(zhī)一,他用(yòng)朋友(yǒu)的(de)照片直接(jiē)带她们走进动漫世界。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行(xíng)业?_黑(hēi)料(liào)正能量

viggo先用StableDiffusion图片转文(wén)字。

再用(yòng)Text2Prompt插件拓展找到对应的关键词;最后用ControlNet插件绑(bǎng)定骨骼开始换关键(jiàn)词试效(xiào)果。

ChatGPT之(zhī)后(hòu)又(yòu)一(yī)应(yīng)用杀疯了(le),AIGC或进(jìn)入可控期,将(jiāng)洗牌(pái)科技行业?_黑料正能量(liàng)

通过图片就可(kě)以看(kàn)出来,效果十分(fēn)惊(jīng)艳。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料(liào)正能量

ChatGPT之后(hòu)又一应用杀(shā)疯了(le),AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能量

更厉害的是,除了真实(shí)的照片,草图也可以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还(hái)能(néng)实现(xiàn)线稿(gǎo)转全彩图。大神(shén)张吕敏其本(běn)尊(zūn)也亲自回应。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可(kě)控(kòng)期,将洗牌(pái)科(kē)技(jì)行业?_黑料(liào)正能(néng)量

不得不说当下AIGC已(yǐ)经变得越来越强大,甚至输出(chū)的作(zuò)品都已经能以(yǐ)假乱真(zhēn)了。

02

难辨虚(xū)实,AIGC技术力(lì)爆发(fā)

警惕安全问题(tí)

近日,“苏州金(jīn)鸡湖有游艇party”的消息火(huǒ)遍网络,而经过警方辟谣这所谓(wèi)的“party”可能是全国第一(yī)起(qǐ)AI绘(huì)图诈(zhà)骗。

由于(yú)这(zhè)个活动里(lǐ)面给(gěi)出的(de)美女(nǚ)照片都是AI制作的真(zhēn)人照片(piàn)绘(huì)图,因为(wèi)太逼(bī)真(zhēn),被大(dà)家(jiā)当成真事(shì)传播了

ChatGPT之(zhī)后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌科技行业(yè)?_黑(hēi)料正能量

不过仔细观(guān)察(chá)可以发(fā)现(xiàn),活动(dòng)发(fā)起者提供的照片中有(yǒu)个很大的漏洞可以发现并非真人,而是AI绘图,那便(biàn)是图片中女性(xìng)的(de)手指(zhǐ)部分有的存在异(yì)常。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科技行业?_黑料正能量

有行(xíng)业(yè)人事表(biǎo)示:“现在(zài)因为手指部分的绘画算法比较复杂,AI还不太会画人的(de)手,但最新看到(dào)的图(tú)片已经有越来越(yuè)完美(měi)的AI模型(xíng)出现,以(yǐ)后可能就(jiù)完(wán)全(quán)没(méi)有漏洞(dòng)了(le)。

类似的AI作图诈骗(piàn)在国(guó)外也已有发生(shēng)。据英国(guó)广播公(gōng)司报道,土耳其地震期间,有Tiktok用户使用AI合成了儿童受灾的假(jiǎ)照片发布到网络(luò),以此诱骗(piàn)善良的人打(dǎ)赏“捐助”从而实施诈骗。

目前随着技术(shù)发展,AIGC已经(jīng)能做出真人照片般的(de)绘图(tú)效果,如果这(zhè)样的图片被用来诈骗,将(jiāng)非常(cháng)可怕。

此外AIGC还引发了很多(duō)担忧,一(yī)方面,批判者认为AI在“学习”了大量前人的作品之后,其创(chuàng)作没有(yǒu)任何情绪和灵魂,难以(yǐ)和人(rén)类的艺(yì)术创作相提并论(lùn)。

另一(yī)方面,AIGC背后(hòu)的版权(quán)、目(mù)前都并没有(yǒu)得(dé)到有效的解决,还有AIGC会不会(huì)代替(tì)人类“至高无(wú)上(shàng)”的(de)创意(yì)。

马斯(sī)克也强调,人工智能的安全问题需要得到重视,太晚就来(lái)不及(jí)了。

03

AIGC下一站(zhàn)除了视频,还有远方

技术(shù)都是有两(liǎng)面性的,潜在的危害并(bìng)不(bù)能掩盖其光辉的(de)贡献(xiàn)。现在看来,人(rén)工智能技术将(jiāng)是第四次工业革命的核(hé)心驱动力量,将创造新的增长(zhǎng)奇迹。

过去一年(nián),人工智能在(zài)技术(shù)和商业层面都有(yǒu)了(le)巨大进(jìn)展,AI绘画就是人工智能技(jì)术发生方向性改(gǎi)变的一个代表。其下一站或许就是视频(pín)。

此前(qián),Meta和(hé)谷歌先后发布了(le)几条引爆科技圈的(de)短视频。这些视频引(yǐn)发关注并非内容(róng)做(zuò)得多(duō)优秀,反而(ér)都非常简(jiǎn)单,比如一匹正在喝水的马(mǎ),一只画画的(de)玩具熊,或者一段骑摩托车的第(dì)一视角录像(xiàng),随便一个有手机的人都可以随手录下一(yī)段。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入(rù)可控(kòng)期,将洗牌科技(jì)行(xíng)业?_黑料(liào)正能量(liàng)

但这些短视(shì)频的创作方式非常简单(dān),创(chuàng)作者仅仅需要(yào)向AI输入一段(duàn)话,甚至(zhì)只是说一(yī)下要求,AI就可以根据需(xū)要生成一段(duàn)视(shì)频。

谷歌发布的两(liǎng)个(gè)AI生成(chéng)视频分(fēn)别来自于Imagen Video和Phenaki,前者主要突出的是高(gāo)清(qīng),与Meta的Make-A-Video没有太(tài)多(duō)的差别。

在Make-A-Video公布(bù)了(le)AI生成的视频后,AI圈就已经玩了一波梗,一个能够做出更高清视(shì)频的AI还(hái)不(bù)足以在短时间内戳中兴(xīng)奋点。

Phenaki更加令(lìng)人震(zhèn)惊的地方(fāng)在于,它可以制(zhì)作出超(chāo)过2分钟的连贯的也有(yǒu)确切内容的(de)视频,这(zhè)才是真正让人们感到惊喜的地方。因为无论AI生成的(de)视频多么高(gāo)清,也只能是为(wèi)内容生产者提(tí)供一个灵感,一个(gè)素材,一个过场动画(huà)。

不(bù)过能够(gòu)制作出(chū)有(yǒu)具体(tǐ)剧情内容的(de)视频就意味着,一(yī)些视(shì)频创(chuàng)作由AI代替人工完成已经(jīng)初步(bù)有了可能。

当下(xià)AI的发展速度已经超过大部(bù)分人的想象。内容产业的本质是供给创造(zào)需求,AIGC作为全新的内容生产方(fāng)式,可以为(wèi)内容产业带来更新的(de)内容(róng)风(fēng)格、更(gèng)快的(de)生产速度,更低的生产成本,这(zhè)无(wú)疑(yí)会驱动内容(róng)产业的大爆发。

除了AI绘图、视频(pín),AIGC技术(shù)还能应(yīng)用于(yú)音乐、代码、机(jī)器人动作等多(duō)种内容形式的生成(chéng)。不难发现(xiàn)该(gāi)项技术不仅在游(yóu)戏等(děng)行(xíng)业能得到有效应用(yòng),对于下一代互联网各种元素的构建(jiàn)亦有关键(jiàn)意义。

从商业化(huà)的角度来看,文化娱乐(lè)、教育(yù)、传媒等(děng)诸(zhū)多领域,本身就(jiù)对(duì)基于AI的(de)可(kě)视(shì)化内容有强烈(liè)需求(qiú)。

因(yīn)此,AI绘画(huà)及视频或不是结果(guǒ),而只是AI进程(chéng)中的(de)一块重要拼图,有望在技术更新的加持下实现(xiàn)更(gèng)大的应用价值。

AI从理解内容,走向(xiàng)了可(kě)以生成内容(róng),甚至能够创(chuàng)造出独立价值和独(dú)立视角(jiǎo)的内容。AIGC的再次出圈(quān),更代表着未来的先进生产力即将到来。

ChatGPT之后又(yòu)一应(yīng)用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

04

紧(jǐn)抓大(dà)模(mó)型与算力,牢固AIGC底座

从技(jì)术(shù)的(de)发展也可以看(kàn)出,在语(yǔ)言大模型、图像(xiàng)大(dà)模型之后,多模态大模型已经成为了(le)新(xīn)的趋势。

大模(mó)型被(bèi)誉为当前人(rén)工智能发(fā)展的智能底座,是全球(qiú)竞(jìng)争最激烈的研(yán)究方(fāng)向之一,包括谷歌、亚马(mǎ)逊、百(bǎi)度、阿里、腾讯等众多头部企业都在竞相发(fā)力。

不过训(xùn)练大模型的确价(jià)格不菲,以(yǐ)国盛(shèng)证券发布的《ChatGPT需要多少算力》报告估算(suàn),GPT-3训练一(yī)次的(de)成本(běn)约为(wèi)140万美元。而对于一(yī)些更(gèng)大的(de)LLM(大型语言(yán)模型),训(xùn)练成(chéng)本则介于200万美元至1200万美元高价(jià)之间(jiān)。

以ChatGPT在2023年1月的(de)独立(lì)访客(kè)平均数1300万计算,其对应芯片需(xū)求为(wèi)3万多片英(yīng)伟达(dá)A100 GPU,初始投入成本约为(wèi)8亿(yì)美(měi)元(yuán),每日仅电费就在5万美(měi)元左右。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科技(jì)行业?_黑(hēi)料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大算(suàn)力(lì)支(zhī)持。在关注各类大(dà)模(mó)型(xíng)的发展同时(shí),更应(yīng)该(gāi)关注算力网络的(de)建设。

算力网络(luò)正(zhèng)驱动AI产业(yè)发展进入史(shǐ)诗级加速进程,让AIGC及通(tōng)用(yòng)AI这一人工智能发展的终极目标离得更近。

因为(wèi)算力可以对突破性技术(shù)创新(xīn)提供大(dà)力的支持(chí)。这方面,多模态大模型是典型。作为面向未(wèi)来强人工智能、通(tōng)用(yòng)人(rén)工(gōng)智能(néng)的重要技术(shù)创新,多模态大(dà)模型(xíng)已(yǐ)经在(zài)人工(gōng)智能领域提出了很多年,业界也有不少技术突破,但是,多模(mó)态大模型进一步(bù)往下走,算力需求呈几何式上升(shēng),一般的算力基(jī)础设(shè)施很快将(jiāng)难以胜任(rèn)。

从(cóng)图像、文(wén)字、语音单独一项的训(xùn)练(liàn),到双模(mó)态、三模态的(de)跃迁,让人(rén)工(gōng)智(zhì)能可以灵活应对不同模态的转化、像(xiàng)人与世界交互一样(yàng)自(zì)然,这方面(miàn),由(yóu)算(suàn)力网络来驱动(dòng)将有明显优势。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

此外(wài),还有很多需要爆(bào)发式(shì)增长的算力(lì)来支撑的技术创新,将在(zài)人工智能算力网络(luò)支撑下快(kuài)速推进。

AIGC已经露(lù)出曙光,期待在大模型(xíng)和大算(suàn)力的支持下AIGC能(néng)持续颠覆内容生产的方(fāng)式,将(jiāng)创(chuàng)造的边(biān)际成本降低,让(ràng)万众受益。

未经允许不得转载:橘子百科-橘子都知道 外国人吃米饭吗,外国人是不是不吃米饭

评论

5+2=