2023年6月7日 ~ 2023年6月14日
(资料图片仅供参考)
6月14日 | 历史上的今天
今天是6月14日星期三,在1949年6月14日,恒河猴阿尔伯特二世乘坐V-2火箭升至134公里的高度(通常以100公里作为对太空的划分),从而成为太空中的首只猿猴。此前,第一只阿尔伯特猴在1948年乘坐V-2火箭升至63公里的高度。
···
产业动态
01 360发布智脑4.0,已具备跨模态生成能力
6月13日,360公司召开360智脑大模型应用发布会,认知型通用大模型“360智脑4.0”亮相,360AI数字人正式发布。
此外,周鸿祎表示,GPT时代中国自研大模型弯道超车的关键在于发展多模态。360智脑已具备跨模态生成能力,拥有文字、图像、语音、视频处理能力,可以应用于文生图、图生图、文生视频等场景。同时,360AI数字人广场发布,提供200多个角色,包括数字名人、数字员工等类别。
会上,360智脑“文生视频”多模态功能国内首发,任何文字脚本都可生成视频,不受专业技能和素材限制,展示了“无中生有”的能力。
周鸿祎表示,360在大模型上的核心创新在AI数字人,数字人是未来人工智能大模型的最重要的应用入口。360将依托360智脑大模型能力,重新定义“数字人”。区别于传统数字人只能按既定脚本输出内容,360AI数字人的特点在于有记忆、有人设和性格,能够复刻思维方式和人生经历。
02 可一键生成视频,Gen2开放免费试用
近日,被誉为视频版Midjourney、并为Stable Diffusion和《瞬息全宇宙》提供背后技术支持的Runway,其开发的AI视频编辑工具Gen,已经从2月份的第一代升级到了第二代,并且从内测转为正式发布。
今年2月,Runway发布了名为Gen-1的人工智能模型,可以通过应用文本提示或者参考图像所指定的任意风格,将现有视频转换为新视频。
仅仅隔了一个多月,Runway于3月20日正式发布更加强大的Gen-2,完成了从“编辑已有视频”,到“文生视频“的转变,并且提供文本+参考图像生视频、静态图片转视频、视频风格迁移等多个功能。 而眼下,Gen2在3月的内测之后,终于开放了免费试用——尽管目前它生成的视频只有4秒,并有共105秒的使用额度。
在定价方面,Gen2的标准版会员15美元/月,Pro版会员35美元/月,年费会员可以打8折。
据报道,推特网友Steve Mills已经在Gen-2测试版中体验了它的潜在能力——生成MV。这名用户总共生成了大约500秒的视频,并最终剪辑成了140秒的MV。
该作者估计,如果按公开版的价格,整个制作下来至少要花费30美元。再加上之前的学习和摸索阶段,这个价格还会更高。
Runway CEO兼联合创始人Cristóbal Valenzuela在Gen-1发布时就曾表示:“我们曾见证过图像生成模型的大爆发,我坚信2023年会是属于视频生成模型的一年。”
03 ChatGPT更新,可一键生成可视化动图
当地时间6月13日,OpenAI宣布对其大型语言模型API(包括GPT-4和GPT-3.5-turbo)进行重大更新,包括新增函数调用功能、降低使用成本等多项内容。更新后,嵌入式模型成本下降75%,同时把GPT-3.5-turbo的tokens输入长度拓展至16000。
从3月底,ChatGPT更新宣布推出插件功能至今,第三方插件数量已经从10来种增加到了70多种。而在这些插件的支持下,目前的ChatGPT不仅能够生成网页,帮用户找工作,还能直接根据需求进行数据可视化......
目前,新版本的模型已经逐步开始迭代。最新版gpt-4-0613、gpt-3.5-turbo-0613与扩充上下文长度的gpt-4-32k-0613都支持函数调用。gpt-3.5-turbo-16k不支持函数调用,提供4倍上下文长度,意味着一次请求可支持约20页文本。
此外,旧模型也开始逐步废弃。使用初始版本gpt-3.5-turbo、gpt-4的应用将于6月27日自动升级到新版本。需要更多时间过渡的开发者也可以手动指定继续使用旧版本,但9月13日之后所有旧版本请求将彻底废弃。
04 Nature拒登人工智能生成的图片和视频
当地时间6月13日,《自然》杂志在一篇社论中宣布,为了保证研究的诚信、透明和道德,将不会刊登任何使用生成式人工智能(generative AI)工具创作的图片、视频或插图,除非是与人工智能相关的文章。
不过,《自然》杂志并不完全排斥人工智能。该杂志仍然允许在文章中使用生成式人工智能辅助产生的文本,只要在方法或致谢部分明确说明。此外,所有数据的来源,甚至是由人工智能协助产生的数据,都必须由作者提供。但是,《自然》杂志坚决不承认任何生成式人工智能工具作为论文作者。
···
科技前沿
01 Meta发布首个“类人”模型
Meta于当地时间6月13日宣布,将向研究人员开放一种新的“类人”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未完成的图像。
该模型名为 I-JEPA,其利用对世界的背景知识来填补图像中缺失的部分,而不是像其他生成式人工智能模型那样,只根据附近的像素进行推断。这种方法采用了 Meta 公司首席人工智能科学家 Yann LeCun 倡导的类人推理方式,有助于避免人工智能生成图像中常见的错误,比如多出一根手指等问题。
Meta 首席执行官扎克伯格表示,与其他研究者分享 Meta 公司开发的模型可以帮助该公司促进创新、发现安全漏洞和降低成本。他今年 4 月对投资者说:“对我们来说,如果行业对我们正在使用的基本工具进行标准化,那么我们就可以从他人的改进中受益。”
02 DeepMind发布新的AI系统,以发现更快算法
Alphabet (GOOG)旗下的AI研究实验室Google DeepMind的研究人员周三发布了一个新的AI系统,可以提高计算的效率和可持续性。
DeepMind说,发表在科学杂志《自然》(Nature)上的这项最新突破专注于发现更快的计算机算法。计算机算法是软件开发的基础,每天被企业使用数万亿次。
这家位于伦敦的AI实验室以开创性的AI模型而闻名,如AlphaFold和掌握复杂围棋游戏的AlphaGo,它将其新的AI系统命名为AlphaDev。该系统以AlphaZero(AlphaGo的迭代)为基础,使用强化学习,以发现用于排序和散列等计算机科学功能的更快算法。强化学习是一种机器学习的形式,计算机在其中学习并自行制定策略。
DeepMind的首席业务官Colin Murdoch说:“这意味着我们可以使用更少的资源来进行同样数量的计算。”
···
交通驾驶
01 华为拿下“问界”商标,意欲单独造车?
商标电子公告系统显示,共计21个“问界”商标转让申请已被核准,转让人分别为北京永安世达科贸有限公司和北京科创辉达科贸有限公司,受让人均为华为技术有限公司,转让申请的收文时间为今年3月7日和8日。
商标具体类别涉及第12、9、7、39、37、42、2、35、3、4、16、38、11、1、5、21、27、41类,其中12类和9类分别代表汽车和运载工具、电子产品及科学仪器。
据第一财经报道,对于获得“问界”汽车类商标一事,华为方面回应称,“华为不单独造车,和车企一起造好车”没有变化。
另外,据科创板日报报道,问界商标此次被华为成功受让,意味着华为将拥有问界商标的主导权,未来或将成为华为智选车模式的统一品牌命名。
02 蔚来全系降价3万,ES8价格跌破50万元
6月12日,蔚来汽车(下称“蔚来”)宣布调整全系新车的价格,公司全系车型起售价均减3万元。
调整后,ET5的起售价跌破30万元,至29.8万元;今年5月刚上市的全新ES6也降至33.8万元,去年底推出的全新ES8价格也跌破50万元。
此次调整不止限于价格,蔚来用户的用车权益也出现下调。
具体来看,新购车用户首任车主用车权益调整为整车6年或15万公里质保,其中三电系统可享10年不限里程质保;免费换电将不再作为基础用车权益,用户可选择单次付费进行换电,此后将推出灵活的加电补能套餐。
针对已提车用户,蔚来承诺首任车主用车权益保持不变。同时,在购买蔚来新车时,老用户可选择将原车的用车权益转移到新车,或者选择放弃其用车权益从而抵扣3万元至5万元的购车款,公司CEO李斌解释称,老用户在购新车时选择放弃权益可叠加现有降价,这意味着可以便宜6万-8万元。
···
趣闻
01 AI绘画明星公司被曝丑闻:创始人学历造假、拖欠工资
近日,AI领域的明星公司、估值10亿美元的Stable Diffusion背后团队被曝巨大丑闻。
据外媒福布斯报道,30多名团队前员工和投资人都站了出来,细数这家名为Stability AI的老板伊玛德(Emad Mostaque)的几大罪状:包括窃取他人技术成果、拖欠员工工资、学历造假、工作经历造假、夸大公司收入等等。
福布斯报道发布的24小时内,伊玛德便通过博客迅速作出回应,称目前没有学历仅仅是因为没有参加毕业典礼,下个月就能补到学位证书;之前有延期发工资的情况,但后面全都补上了;也不存在剽窃技术成果,因为Stable Diffusion模型的论文有5位作者,3位都在本公司工作……
总之,对于一系列毫不留情的指控,伊玛德一一进行了回复,表示目前“公司经营良好”,也已结清了公司层面的欠款,还强调“公司所做的一切都会受到严格审查”。
不过,仍有网友,包括Stability AI的一些前员工对这份回复并不买账,指出福布斯报道中一些很关键的点,比如拖欠员工工资的部分质疑并没有完全澄清。
采写:南都记者胡耕硕