AIGC办公,让颤抖的职场精英能更快乐地摸鱼
AIGC+办公,让颤抖的职场“精英”能更快乐地“摸鱼”
在过去的几十年里,人工智能(AI)已经从科幻小说中的概念幻想,华丽转身,融入了我们日常生活的方方面面。 如今, 以AI为核心的内容生成技术(AIGC)更是犹如一股创新之风,席卷整个创作领域,引领着一场前所未有的革命。
在经历了ChatGPT、Midjourney等国际AIGC产品的飞速发展,以及百度文心、阿里通义、Kimi等国内AIGC产品的激烈追赶后, 2024年,几乎每位互联网用户都或多或少接触了AIGC技术产生的内容 。从智能手机中的大模型助手,到日常所见的AI生成图片,再到职场中的AIGC工具辅助优化工作,AIGC内容已遍布人们的生活中。
尽管AIGC技术的应用仍存在一些争议,但其带来的极大便利已让人们难以拒绝。
AIGC 是什么?
AIGC 全称为 AI-Generated Content,直译:人工智能内容生成。即采用人工智能技术来自动生产内容。那么,AIGC 采用了什么人工智能技术?可生成什么内容?
对以上两个问题进行回答,首先,从 技术层面 AIGC 可分为三个层次,分别为:
1、智能数字内容孪生:
简单来说,将数字内容从一个维度映射到另一个维度。与生成有什么关系呢?因为另一个维度内容不存在所以需要生成。内容孪生主要分为内容的增强与转译。增强即对数字内容修复、去噪、细节增强等。转译即对数字内容转换如翻译等。
该技术旨在将现实世界中的内容进行智能增强与智能转译,更好地完成现实世界到数字世界映射。例如,我们拍摄了一张低分辨率的图片,通过智能增强中的图像超分可对低分辨率进行放大,同时增强图像的细节信息,生成高清图。再比如,对于老照片中的像素缺失部分,可通过智能增强技术进行内容复原。而智能转译则更关注不同模态之间的相互转换。比如,我们录制了一段音频,可通过智能转译技术自动生成字幕;再比如,我们输入了一段文字,可以自动生成语音,两个例子均为模态间智能转译应用。
【应用】:图像超分、语音转字幕、文字转语音等。
2、智能数字内容编辑:
智能数字内容编辑通过对内容的理解以及属性控制,进而实现对内容的修改。如在计算机视觉领域,通过对视频内容的理解实现不同场景视频片段的剪辑。通过人体部位检测以及目标衣服的变形控制与截断处理,将目标衣服覆盖至人体部位,实现虚拟试衣。在语音信号处理领域,通过对音频信号分析,实现人声与背景声分离。以上三个例子均在理解数字内容的基础上对内容的编辑与控制。
【应用】:视频场景剪辑、虚拟试衣、人声分离等。
3、智能数字内容生成:
智能数字内容生成通过从海量数据中学习抽象概念,并通过概念的组合生成全新的内容。如 AI 绘画,从海量绘画中学习作品不同笔法、内容、艺术风格,并基于学习内容重新生成特定风格的绘画。采用此方式,人工智能在文本创作、音乐创作和诗词创作中取得了不错表现。再比如,在跨模态领域,通过输入文本输出特定风格与属性的图像,不仅能够描述图像中主体的数量、形状、颜色等属性信息,而且能够描述主体的行为、动作以及主体之间的关系。
【应用】:图像生成(AI 绘画)、文本生成(AI 写作、ChatBot)、视频生成、多模态生成等。
从 生成内容 层面 AIGC 可分为五个方面:
1、文本生成
基于 NLP 的文本内容生成根据使用场景可分为非交互式与交互式文本生成。非交互式文本生成包括摘要/标题生成、文本风格迁移、文章生成、图像生成文本等。交互式文本生成主要包括聊天机器人、文本交互游戏等。
【代表性产品或模型】:JasperAI、copy.AI、ChatGPT、Bard、AI dungeon 等。
2、图像生成
图像生成根据使用场可分为图像编辑修改与图像自主生成。图像编辑修改可应用于图像超分、图像修复、人脸替换、图像去水印、图像背景去除等。图像自主生成包括端到端的生成,如真实图像生成卡通图像、参照图像生成绘画图像、真实图像生成素描图像、文本生成图像等。
【代表性产品或模型】:EditGAN,Deepfake,DALL-E、MidJourney、Stable Diffusion,文心一格等。
3、音频生成
音频生成技术较为成熟,在 C 端产品中也较为常见,如语音克隆,将人声 1 替换为人声 2。还可应用于文本生成特定场景语音,如数字人播报、语音客服等。此外,可基于文本描述、图片内容理解生成场景化音频、乐曲等。
【代表性产品或模型】:DeepMusic、WaveNet、Deep Voice、MusicAutoBot 等。
4、视频生成
视频生成与图像生成在原理上相似,主要分为视频编辑与视频自主生成。视频编辑可应用于视频超分(视频画质增强)、视频修复(老电影上色、画质修复)、视频画面剪辑(识别画面内容,自动场景剪辑)。视频自主生成可应用于图像生成视频(给定参照图像,生成一段运动视频)、文本生成视频(给定一段描述性文字,生成内容相符视频)。
【代表性产品或模型】:Deepfake,videoGPT,Gliacloud、Make-A-Video、Imagen video等。
5、多模态生成
以上四种模态可以进行组合搭配,进行模态间转换生成。如文本生成图像(AI 绘画、根据 prompt 提示语生成特定风格图像)、文本生成音频(AI 作曲、根据 prompt 提示语生成特定场景音频)、文本生成视频(AI 视频制作、根据一段描述性文本生成语义内容相符视频片段)、图像生成文本(根据图像生成标题、根据图像生成故事)、图像生成视频。
【代表性产品或模型】:DALL-E、MidJourney、Stable Diffusion 等。
AIGC +办公
伴随着AI的进一步发展,生成式AI长期可能创造新的办公模式,在容错率较低的行业和办公环节也能实现自动应用,每个人都可能拥有自己的AI办公助理,AI将较大程度被应用在日常办公中,不仅仅作为现有工作的辅助工具,而是真正成为独立的生产力, 将解放现有劳动力并实现生产力的又一次变革 。
文心一言
文心一言是由百度研发的 AI 大模型。
这款大模型拥有文本创作、PPT 大纲、日报生成等 390 种应用场景,
现在的文心一言支持网页端和 APP 端,所有用户都能免费使用 3.5 版本!
如果你是个急性子,想让 AI 更快更好地回答你的问题,那你可以选择氪金体验文心一言 4.0 版本~
讯飞星火
讯飞星火是由科大讯飞推出的 AI 大模型。
它同样拥有超多 AI 功能:内容创作、AI 绘画、一键编程等 400 余种!
而且它还内置了一键生成 PPT 的 AI 插件,
5 秒生成一套 PPT 模板,你再也不用花时间到处求模板~
通义千问
通义千问是阿里云研发的 AI 大模型,实力不输前两位 AI 选手!
腾讯混元
看完前三位 AI 大模型的表现,最后来看腾讯研发的腾讯混元 AI 大模型吧。
这款大模型使用方法比较特殊,不需要打开网页或者下载 APP,
只需要在微信里搜索官方小程序「 腾讯混元助手 」
不仅功能和网页端差不多,在小程序里同样能免费体验 AI 生图!
WPS AI
作为国内办公软件的佼佼者,WPS 在 AI 赛道的成绩也是相当优秀~
最新版 WPS 已经内置了超多实用的 AI 功能:
一键写文章
一键生成 PPT
Excel 表格自动归纳
……
可灵
【文生视频】
输入提示词即可产生视频
抽象出一个简单的公式:
提示词(Prompt)= who(主体描述)+ what(性质状态) + where(场景描述)
如果还有更加高的要求,就加入镜头语言和光影,辅助氛围描写,视频画面的质感会有所提升,将更满足对镜头和光影等方面的需求。
【文生视频】
上传任意一张图片,可灵AI就能够根据图片的信息生成5s 或10s 视频的视频,同时还支持添加文本提示词来管控图像的运动。
图生视频是AI视频的一条重要技术路线。通过提供基本图片,可以让画面保持连贯性、一致性,便于创作连续性的长视频,极大降低了专业视频的创作成本与门槛。
**更多关于AI领域实用信息
关注芝诺数据 跟踪报道,敬请留意!**
结语
AIGC作为一种新兴的人工智能技术,已经在各行业中展现出巨大的潜力。合理运用AIGC,可以有效提升工作效率,减轻工作负担。以下是一些建议:
了解AIGC产品:根据自身需求,选择合适的AIGC产品和服务。
学习AIGC技术:掌握AIGC的基本原理和应用方法,以便更好地运用到工作中。
持续关注AIGC发展:密切关注AIGC领域的最新动态,把握技术发展趋势。
结合实际场景:根据工作需求,将AIGC技术与实际场景相结合,提高工作效率。
保持创新意识:不断探索AIGC技术在各自领域的创新应用,为行业发展贡献力量。