🌓
搜索
 找回密码
 立即注册

快来看看哪些AI项目入选了《时代》2023年200项最好的发明

admin 2023-10-25 18:30:34 89144
TIME每年都会在《TIME最佳发明》专题中重点介绍最具影响力的新产品和创意已经超过20年。

为了编制今年的名单,TIME向全球的TIME编辑和通讯员征集提名,并通过在线申请流程,特别关注了人工智能、绿色能源和可持续发展等不断发展的领域,然后根据原创性、效果、雄心和影响等多个关键因素对每个候选者进行评估。

结果是一个包含200个开创性发明的名单,其中包括全球最强大的超级计算机、改变游戏规则的娱乐场所和一种新形态,它们正在改变我们生活、工作、娱乐和思考可能性的方式。

✨摄影编辑突破创新

Adobe Photoshop生成扩展和生成填充

Adobe通过将技术直接整合到全球最受欢迎的图像编辑器Photoshop中,为数百万人提供了强大的人工智能功能。

搭载Firefly技术的Adobe AI图像生成器,现在在Photoshop中包含了生成扩展和生成填充功能。前者可以无缝地填充图像边界之外的想象内容。后者允许您通过输入简单的文本在现有图像中添加或删除某些元素。

这两种功能都不需要专业技术知识。Adobe数字媒体高级副总裁Ashley Still说道说:“这些选项使得客户能够按照他们的想象力的速度将自己的想法变为现实。”

改变游戏规则的聊天机器人

OpenAI GPT-4

距离其于三月发布已经过去了八个月,OpenAI的GPT-4仍然是对公众开放的最强大的聊天机器人。尽管它的前身ChatGPT在法律考试中的表现超过了只有10%的学生,但GPT-4超过了其中的90%。

它擅长语言推理,能够将复杂的概念解释为简单的语言,甚至可以解释为什么一个笑话有趣。在九月,OpenAI开始推出与该模型通过语音进行互动以及使用图像作为输入的功能。

创新影片编辑

Runway Gen-2

六月份,Runway推出了其Gen-2模型,这是一家得到谷歌支持的初创公司,其视觉效果工具曾被用于帮助制作奥斯卡获奖影片《Everything Everywhere All At Once》中令人眼花缭乱的图形。

新版本允许任何人只需通过文本提示、图像或其他视频生成完整的视频。Runway的联合创始人兼首席执行官Cristóbal Valenzuela将这项新技术比作200年前相机的发明。他说:“AI是一种全新的相机,将永远改变故事叙述方式,并导致完全由AI生成的完整电影。”

真实的人工智能

Alitheon FeaturePrint

解决数万亿美元的假冒商品问题的一个解决方案可能就像简单地将手机相机对准手表或手袋,让智能软件确定其真伪那样简单。

FeaturePrint是一种光学人工智能技术,首先“观察”物理物品的微小表面细节,并将其“指纹”成独特的数学身份。然后,只需点击一个按钮,它就能告诉您该物品是假货还是真品。

Alitheon首席执行官Roei Ganzarski表示:“不需要贴纸、标签或标记。”其中一位客户是为国家银行制造金条的Argor-Heraeus公司。

天空中的眼睛

Dedrone全城无人机侦测

无人机既可能带来破坏,也可能带来好处。Dedrone的全城无人机侦测产品在一个地理区域周围形成了一道虚拟屏障,如果无人机进入指定的空域,它会在几秒钟内向执法部门发出警告。

Dedrone通过追踪无人机发出的一系列信号,包括无线电频率、ADS-B数据(也用于飞机)和RemoteID信标,来确定入侵的位置。

精通翻译师

Meta SeamlessM4T

Meta将其SeamlessM4T AI模型与《银河系漫游指南》中的巴别鱼(Babel Fish)智能语言翻译器进行了比较。

该公司的软件能够理解近100种语言的语音或文本,并能够实时以各种格式进行即时翻译,包括语音到语音、文本到文本、语音到文本或文本到语音。除了能够处理比之前更多的语言外,据Meta称,该系统更高效、更少出错,甚至可以解析同一句子中多种混合语言。Meta已经将该模型开源,这意味着全球的研究人员都可以使用其代码。

惊人的模仿能力

So-VITS-SVC

今年早些时候,一个化名为Ghostwriter的匿名创作者发布了一首名为《Heart on My Sleeve》的歌曲,其中包含了听起来像Drake和The Weeknd的令人信服的AI生成的人声。

这些声音是使用称为So-VITS-SVC的开源软件创建的,该软件允许技术熟练的人员对歌手的声音进行神经网络训练,然后使用AI生成的人声来演唱任何歌曲。爱好者们在Discord社区中交换声音模型,从Bad Bunny到Taylor Swift再到James Hatfield的人声都有。

与此同时,使用该软件的用户友好型网站也如雨后春笋般涌现。

遏制山火

AlertCalifornia和Cal Fire AI山火探测器

在火势蔓延之前探测到山火是当前困扰世界各地的一项挑战。加州圣地亚哥大学的公共安全项目AlertCalifornia正在利用人工智能来提供帮助。

该项目与Cal Fire合作,通过从遍布全州的超过1,050个摄像头网络中获取的视频流,对人工智能进行训练,以检测烟雾和火灾的早期迹象。当系统发现异常情况时,它会通过短信通知当地消防部门。

在前两个月,该系统在任何911呼叫进来之前正确地识别出了77起火灾。“这个系统最成功的故事是你从未听说过的火灾,”AlertCalifornia的副首席调查员Falco Kuester说道。

轻松创作音乐

Stable Audio

利用生成式人工智能的力量,由Stability AI创造的Stable Audio可以通过几个简单的文本提示制作出几乎任何您想要的声音或歌曲。

例如,键入“氛围技术,鼓机器,宁静,器乐”会得到一首轻松的新世纪音乐,在时尚休息室中别具一格。该模型是在一个股票音频网站的数据集上进行训练的(因此完全合法),该数据集包含超过800,000个音频文件,总计达到20,000小时,可用于专业和业余项目。

保护动物

TrailGuard AI

在印度和非洲的一些地区,偷猎仍然是大象和大型猫科动物最大的灭绝威胁,即使在受保护的区域也是如此。

TrailGuard AI是由美国环境组织Resolve创建的系统,它使用由英特尔提供技术支持的微型摄像头来监测濒危物种并发现偷猎者。该系统使用蜂窝网络或远程无线电信号将图像传输到有关部门的手机中,传输时间仅需30秒。

TrailGuard的定制AI模型不仅可以训练以检测人类,还可以检测任何感兴趣的物种,从老虎到鬣狗不等。这项技术在东非的测试阶段已经导致逮捕了30多名偷猎者,目前正在老虎密集的印度中部进行大规模测试。

想象力的图像呈现

OpenAI Dall-E 3

当OpenAI在去年11月推出ChatGPT时,它彻底改变了人工智能领域的格局。该公司希望DALL-E 3——其AI图像生成器的新版本,将产生同样的影响。

OpenAI的Aditya Ramesh称,以前的图像生成器需要学习一种新的技术语言,包括在字符串中添加减号和数字,以获得最佳结果。而DALL-E 3并非如此,它与ChatGPT相结合,用户可以输入对话式命令,得到与其描述相匹配的图像,无需学习新的技术语言。

倾听吧

Project Gutenberg开放式有声书收藏

Project Gutenberg是最古老的数字图书馆,成立于1971年,旨在使电子书更易获取。但首席执行官Greg Newby表示,它“在创作和分发方面都不太出色”。

因此,微软和麻省理工学院合作推出了开放式有声书收藏,利用文本转语音技术将5000本书转化为免费的合成叙述的有声书,现已在Spotify上提供。推动该项目的软件也是免费发布的。

解构节奏

AudioShake

最近,当一支最大的摇滚乐队签下一项协议,将他们70年代的热门歌曲用于商业广告时,乐队成员们感到非常高兴。然而出现了一个问题:广告制作人只想要乐器部分,而乐队只有最终混音版本。

因此,摇滚乐队的团队找到了AudioShake,他们的人工智能程序可以将预先录制的音频分离成其组成部分。“我们使音频变得交互和可编辑,使得这些真正实用的用途成为可能,帮助艺术家赚钱,”共同创始人兼首席执行官Jessica Powell说道。

重新思考智能手机

Humane Ai Pin

Humane的创始人是两位前苹果高管,他们展望了一个无屏幕的未来,而Ai Pin是他们的第一步。一旦这款轻巧的Humane Ai Pin磁性地连接在您的衣物上,它就成为您的基于人工智能的个人助理。

该设备使用专有软件和OpenAI的GPT技术,让您可以通过语音完成从提问复杂问题到打电话和发送短信等一切操作。同时,内置摄像头可以识别物体并提供上下文信息,例如食物的卡路里估计。一个显眼的隐私指示灯称为“信任灯”,在Pin的摄像头、麦克风或输入传感器激活时亮起,确保周围的人都知道它何时在听或录音。如果您需要视觉效果,一个微型投影仪会将影像直接投射到您张开的手掌上。这款手机的销售计划于11月9日推出。


转发公众号任一文章到朋友圈百人微信群

添加以下微信,发送截图

即可领取AI学习资料


111968.jpg
随机推荐

最新主题

1 回复

ylin012
2023-10-25 18:30:34
帮你顶下哈!!
高级模式
游客
返回顶部