上周有个重要新闻:时代杂志2023年最佳发明200个(全部提名:https://time.com/collection/best-inventions-2023/)。
其中与信息相关的有AI类,共有14个AI科技产品上榜;有APP&software类,8个上榜;AR&VR类有4个上榜;机器人有7个上榜。
下面一起看看:
首先看看AI类,我还整理了对应解决方案。
1.Adobe Photoshop图像生成填充
网址:https://pan.quark.cn/s/4b0e76b85c51
这个也是我最喜欢的 :使用“创意填充”工具制作精美的图像
仅在 Photoshop (Beta) 桌面应用程序中可用
“创意填充”是一个神奇的新工具,它基于您与生俱来的创造力,使您能够使用简单的文本提示以非破坏性的方式添加、扩展或移除图像中的内容,以获得逼真效果,让您在几秒钟内感到惊叹、喜悦和震撼。
但是在photoshop beta 使用 AI功能时,会判断用户的所在地区,就不让用了?
这时候就推荐一个:突突加速器
在加速器界面搜索 photo找到我们需要加速的应用
给应用加速一下我们就能使用 photoshop beta 的AI功能啦
启动 photoshop beta
在 photoshop beta 在中找到窗口->上下文任务栏 可以找到AI工具
选出我们想要修改的场景
在输入框里面输入我们命令就可以让AI给我们打工了。
PS: 另外想自己装PS2023版的,把文件和教程全部整理到网盘了:
我用夸克网盘分享了「Ps ai pr ae.. beta 激活版 ( adobe 走进人工智能)」,点击链接即可保存。
链接:https://pan.quark.cn/s/4b0e76b85c51
2、改变游戏规则的 openai 的GPT-4
网址:https://pan.quark.cn/s/88258779c089
不限速官网:https://dmla.lanzoup.com/b05pao8eh
这个是AI集成,可以生成文案、图片、PPT
生成文案,调用的ChatGPT。
每个账号,每天可以免费用5次。
3、动画生成工具 runwayml和 Gen-2 模型
网址:https://runwayml.com/
这个入选,最不意外了。因为它太强大了,梦幻般的功能。
例如:只需输入文字,即可利用Ai算法抠像,看一段视频:
去除杂物就是它的一个小功能之一,直接在画面上涂抹即可~
再看看用GEN2生成的视频:
Gen-2可从文本、图像或视频生成完整视频,被视为“一种崭新的摄像机”,有望彻底改变未来的视觉内容创作方式。登录不用魔法,直接打开网站https://runwayml.com
就是注册必须用谷歌邮箱或苹果的ID号,进去后界面如下
选text to video或者下面的gen2进入,
也可以直接输入要求(prompt)生成视频。
上传你的图片
设置图片的要求,可以输入自己想要效果的prompt,也可以自动处理,点击generate即可完成即可。
缺点就是免费的限制太多了:
4、Alitheon的FeaturePrint技术
这个之前没有了解过,详细看了一下是种光学 AI 防伪标识,用户只需要普通的相机拍摄照片就可以验证。
该技术通过分析物品表面微细细节,生成唯一识别码,用户只需拍照即可检测商品的真伪性。
不需要安装硬件就可以对一定范围内的无人机进行监测,并记录违反关键警报区域、违反禁飞区域、越境侵入等的飞行。该系统可以在数秒内检测进入禁飞区的无人机,对保护重要基础设施具有重要作用。它被称为无人机的“空中交通管制系统”。6、Meta 的基础多模态 AI 翻译模型 SeamlessM4T。支持近100 种语言的自动语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译和文本到语音翻译。网址:https://pan.quark.cn/s/af09bbd3633c
AI 声音克隆!
堪称翻唱神器。
今年四五月份的 AI 孙燕姿,曾经火爆网络。
听听效果:
网盘里有完整安装包。https://pan.quark.cn/s/af09bbd3633c
总之这个用于生成的AI虚拟人声很逼真,是音乐创作领域的创新技术。
8、AlertCalifornia 和加州消防人工智能的野火探测器
这是个森立火灾预警系统。
当系统发现异常时,它会通过短信向当地消防部门发出警报。
该系统运用AI视觉识别技术实现了加州森林火灾的早期预警。在头两个月里,系统已经在收到任何911电话之前正确检测到77起火灾,提升了火灾应对响应速度。
9、Stability AI开发的 AI 音乐生成工具Stable Audio网址:https://stableaudio.com/可以通过几个简单的文本提示生成几乎任何声音或歌曲。拓展了音频内容创作的可能性。其易用性、高效性和商业价值等诸多优势表明,人工智能在音乐创作领域具有巨大的潜力。
用户只需输入文字提示和持续时间,即可创建原创音频,并生成高质量、44.1 kHz 立体声音频。它使用潜扩散音频模型,该模型是在领先的音乐库 AudioSparx 的数据基础上训练出来的。该模型是在一个库存音频网站的数据集上训练出来的(所以都是合法的),其中包含 80 多万个音频文件,总计 2 万小时,可用于专业和业余项目。
https://stableaudio.com/ 咱们大陆用户可以直接登录,
这个用QQ邮箱就可以登录,可以免费试用,额度不够了,再多注册几个账号。
10、TrailGuard AI系统
该系统通过识别偷猎者保护印度和非洲的濒危动物,有效防止偷猎活动。
该系统使用Intel提供的小型摄像头来监控濒危物种并发现偷猎者。使用无线电或长距离无线电信号将图像传输到最短30秒内的当局手机上。11、OpenAI出品的图像生成模型DALL-E 3
网址:https://openai.com/dall-e-3
以前图像生成器需要学习一种新的技术语言,包括用减号和数字附加字符串,才能获得最佳结果。
但 DALL-E 3 则不同,它可以折叠到 ChatGPT 中,用户可以输入会话命令,获得与其描述相匹配的图像。
再看看DALL-E 的擦除功能:
网址:https://openai.com/dall-e-2/
输入“文字”,就能自动擦除图片中的内容。
比如客户说:下图的水瓶和口罩有点乱,麻烦P掉。
放在以前,我可能会……???¥*¥&…%&…?
而现在:选择范围,然后输入文字“edit a desk”即可。
感谢AI
12、有声书--Project Gutenberg Open Audiobook Collection
网址:https://www.gutenberg.org/
Project Gutenberg是最古老的数字图书馆,微软和麻省理工学院联手推出了开放式有声读物集合。使用文本转语音技术将5000本书转换为免费的合成朗读有声读物。
古腾堡计划利用AI技术生成了5000本免费有声书,并在Spotify上免费提供,推动了知识传播和阅读普及。
相关资料:
古腾堡工程
网址:https://www.gutenberg.org/
7万本免费电子书。
选择免费的电子书和电子书,下载或在线阅读。你会在这里找到世界上最伟大的文学作品,重点放在美国的老作品上。版权到期了。数以千计的志愿者数字化并勤奋地校对电子书,供你欣赏。
13、AudioShake音频分离技术,分解音拍
类似网址:https://vocalremover.org/zh/
类似网址:https://songdonkey.ai/
AI可以隔离预先录制的音频的元素,将其分解成各个组成部分。
解决一些老音乐无法分离特定音轨的问题。
14、智能语音助手--Humane Ai Pin
一个不需要屏幕的语音交互式可穿戴设备,被认为可能定义未来的可穿戴设备形态。
这个我也是第一听说,从网上找了了些资料:
AI Pin 计划于 11 月 9 日推出。下方为AI Pin 的介绍影片。大家可以看看视频:
创办 Humane 公司的两位前苹果公司高管憧憬着一个没有屏幕的未来,而 Ai Pin 就是他们迈出的第一步。
一旦轻巧的Humane Ai Pin通过磁力吸附在你的衣服上,它就会成为你的人工智能私人助理。
通过混合使用专有软件和 OpenAI 的 GPT-4,该设备可以让你做任何事情,从提出复杂的问题到拨打电话和发送短信,所有这些都只需要你的声音。
同时,内置摄像头可以识别事物并提供上下文信息,例如食物的卡路里估计值。
每当 Pin 的摄像头、麦克风或输入传感器处于激活状态时,一个名为 "信任灯 "的显著隐私指示灯就会亮起,以确保周围的人都知道它在监听或录音。
如果你需要视觉效果,一个微型投影仪会将它们直接投射到你伸出的手掌上。
其次,看看软件类,含APP。
AR&VR类:
最后是机器人:
提示:今天因为篇幅原因,就贴图了,不解释了。如果今天点赞或留言的多,明天就详细解释下soft类,AR&VR类。