CQ9电子Meta硬件与Megabyte架构;Anthropic的C轮融资!BingChat插件;G7监管|Weekly Summary
栏目:公司动态 发布时间:2023-05-28
 Meta AI提出了一种名为Megabyte的新的AI模型架构,可以在多个格式中生成超过100万个标记。Megabyte解决了当前模型的可扩展性问题,并并行执行计算,提高了效率,超越了Transformers。  微软首席营销官在公司的Yammer群组中回应了一条抱怨停止加薪的信息,他表示这些变化部分是因为微软希望投资于AI浪潮。  Meta的第三轮裁员将影响到其业务组的成员,包括在用户体验、

  Meta AI提出了一种名为Megabyte的新的AI模型架构,可以在多个格式中生成超过100万个标记。Megabyte解决了当前模型的可扩展性问题,并并行执行计算,提高了效率,超越了Transformers。

  微软首席营销官在公司的Yammer群组中回应了一条抱怨停止加薪的信息,他表示这些变化部分是因为微软希望投资于AI浪潮。

  Meta的第三轮裁员将影响到其业务组的成员,包括在用户体验、营销、招聘和工程方面担任职务的人员。

  亚马逊的云客户渴望使用该公司在六周前推出的ChatGPT风格技术。但是,许多人被告知坐等,引发对该 AI 工具并未完全成熟的担忧。

  微软发布了Windows Copilot,使Windows 11成为首个宣布提供集中式AI助理的PC平台,帮助用户轻松采取行动并完成任务。此外,微软还将Bing Chat插件扩展到Windows,使开发者能够将其应用程序集成到Windows Copilot中,为客户提供更好的服务,并提高原生Windows应用程序的参与度。

  谷歌宣布推出Product Studio,这是一个新工具,利用生成式 AI 让商家能够轻松创建产品形象。品牌将能够在Google的商家中心下一代平台中创建新的形象,该平台用于管理他们的产品在Google上的展示方式。

  微软已同意在其应用程序生成的所有AI艺术品上签名,以加密水印的形式指示其是由算法制作的。

  AI正在改变世界,而治疗似乎成为它的下一个目标。来看看来自Inflection AI的情感支持机器人Pi,这是由LinkedIn和DeepMind的前联合创始人创建的新工作室。该公司雇佣了约600多名兼职“教师”,包括治疗师,来训练其算法成为教练、知己、创意伙伴和助手。

  上周,OpenAI推出了一款ChatGPT的iPhone应用程序,迅速登上了App Store的榜首。截至上周五,ChatGPT在免费应用程序类别中排名第一,苹果将其作为“必备”应用在“Essentials”类别下推广。

  OpenAI预测在未来十年内,AI系统可能在大多数领域超越专家技能。为了管理这一情况,他们提出了三个策略:全球协调AI发展、建立超智能的国际权威机构,以及进行使超智能安全的研究。尽管支持规模较小的AI发展,OpenAI强调强大系统需要公众监督。尽管存在风险,他们相信超智能是不可避免的,并且可以极大改善世界。

  英特尔宣布推出Aurora GenAI,这是它与ChatGPT等AI模型竞争的产品,拥有1万亿个参数。该模型旨在完成复杂任务,承诺提供增强的对话、翻译、摘要和编码能力。这是英特尔宏大的AI战略的一部分,与学术和研究机构合作开展。

  数据分析公司Palantir,由Peter Thiel共同创立,其军事 AI 平台将在本月面向部分客户推出。

  与其他科技巨头相比,Meta一直比较低调,但他们推出了一款用于AI推理工作负载的定制芯片。这款7纳米芯片在功耗和速度上与许多其他硬件产品相匹配。

  苹果正在开发自己类似的技术,因此限制了ChatGPT和其他外部 AI 工具的使用。

  第 69 届彼德伯格会议在2023 年 5 月 18 日至 21 日于葡萄牙里斯本举行,来自 23 个国家的约 130 名与会者已确认出席,他们是来自工业界、金融界、学术界、劳工界和媒体的政治领袖和专家组成的多元化团体;OpenAI首席执行官Sam Altman将与微软和谷歌等公司的主要领导人联手参加这场会议。

  这家科技巨头公开发布了最新的 AI 技术,以便人们可以构建自己的聊天机器人。谷歌等竞争对手表示,这种方法可能存在风险。

  对于Elon Musk在OpenAI的贡献一直存在争议。尽管最初声称他投资了1亿美元,但文件显示实际金额为5000万美元。马斯克表述和文件中记录的数字不一致引发了对AI资金的透明度和问责制的讨论。

  2018年,Yoshua Bengio与Geoffrey Hinton和Yann LeCun一起获得了图灵奖。他表示,大型科技公司最近急于推出 AI 产品的行为已经变得“不健康”,并且他认为这对政治体系、民主制度和真理本质构成了“危险”,政府需要迅速采取行动“保护公众”。

  LoRA是一种比完全微调更便宜地微调模型的方法。它通过仅更新模型的一小部分进行工作,这些部分经过精心选择。然而,即使如此,使用普通硬件在大型(超过130亿参数)模型上进行微调通常仍然过于昂贵。量化降低了模型中参数的精度,从而占用更少的空间。开源进展更加出色。

  SEAHORSE是一个数据集,用于评估多语言摘要系统的质量。它包含了96,000个根据六个重要方面(清晰度、重复、语法、归属、主要观点和简洁性)由人类评分的摘要。该数据集不仅作为评估自动度量性能的基准,还为训练这些度量提供了宝贵的资源,帮助研究人员推动多语言摘要评估领域的发展。

  本文介绍了Meta上下文学习,这是一种用于大型语言模型的递归自我改进过程。通过研究回归和决策任务,研究人员证明了Meta上下文学习增强了模型的上下文学习能力,修改了它们的策略,并在实际问题上取得了竞争性能。

  ControlVideo是一种新颖的框架,通过引入一种无需训练的方法来解决从文本生成视频的限制。通过利用结构一致性、增强外观一致性、减轻闪烁效果和采用分层抽样,ControlVideo在生成高质量的短视频和长视频方面胜过现有方法。重要的是,ControlVideo能够以高效的方式实现这些结果,仅使用一张NVIDIA 2080Ti GPU在几分钟内生成视频。

  该文章讨论了一项研究,该研究将人类听取一个简单声音时产生的脑电波与神经网络分析相同声音时产生的信号进行了比较。结果非常相似,表明自然和人工网络在学习方面以相似的方式进行,至少在语言方面是如此。

  Transformer已经取代了循环神经网络成为大多数基于文本的任务的主要工具。然而,由于架构的原因,这些Transformer在成本和上下文方面存在一定限制。RWKV是一种注意力变体(模糊地类似于线性注意力),声称将Transformer和循环模型的优点结合起来。Discord上的讨论非常活跃,但还没有正式的详细介绍这个备受瞩目的模型。这篇论文是第一篇对该模型进行深入解释的论文。

  Safetensors是一个避免加载来自互联网的任意二进制文件(pkl)中的许多陷阱的库。具体来说,加载预训练模型可能会使攻击者能够运行任意代码。幸运的是,Safetensors缓解了这个问题,并允许与未知参与者安全共享张量风格的工件。

  Meta的科学家们通过名为Massively Multilingual Speech(MMS)的项目取得了机器学习理解和说多达1,100种语言的突破。这项技术利用了自学系统和超过1,100种语言的数据库,旨在使信息更易获取,并帮助保护许多濒临消失的语言。

  研究人员引入了一个名为CRITIC的系统,使大型语言模型(LLM)能够验证和改进其输出,方式类似于人类使用事实核查或调试工具。该过程涉及模型产生初始输出,与工具进行交互评估,然后根据接收到的反馈修改输出。这已被证明能够提高LLM在问答、程序合成和减少有害性等领域的性能。

  最近,强化学习在人类反馈方面受到了广泛关注。事实证明,您也可以将计算反馈用作奖励模型。在这项工作中,他们使用LLaVA视觉问答系统为多个不同任务提供bert分数。有趣的是,他们能够大幅提高基础扩散模型的性能。

  将某物对齐到人类价值观意味着什么?是否存在广泛的人类价值观?这篇很棒的文章探讨了使用强化学习来对齐模型的想法。社区中有这样一种观点,即由于对齐没有明确定义、用于生成人类反馈的组合不可复制以及这些模型发生了相当大的变化,这些因素共同意味着通过强化学习实现对齐可能比炒作所暗示的更难。

  作者介绍了一种独特的AI模型,名为可组合扩散(CoDi),它可以根据任意组合的输入生成任何混合输出类型,如语言、图像、视频或音频,这使其与传统的AI系统有所不同。尽管许多输入-输出组合缺乏训练数据,但CoDi通过对齐输入和输出领域中的模态来成功弥补差距,使得可以同时生成相互关联的模式,即使它们不是原始训练数据的一部分。

  GPT-JSON是围绕GPT的一个包装器,允许以声明方式定义预期的输出格式。设置模式、编写提示,并以漂亮的类型提示对象形式获取结果。

  探讨了由于希望将专业知识排除在AI训练数据集之外而导致新知识的大规模孤立的问题。

  研究人员开发了一种名为DragGAN的工具,允许用户通过拖动图像中的任意点到目标位置来精确修改图像,实现姿势、形状、表情和布局的变化。它在超越现有图像处理方法方面表现出色,不仅在创建逼真结果方面效率高,而且在操纵真实图像时仍能跟踪变化。

  作者们设计了一种新的方法,通过使用虚拟模拟器给语言模型提供“具身体验”,从而教会它们理解和规划现实世界中的事物。这种新方法显著提高了模型的能力,并使较小的模型表现得与ChatGPT等较大模型一样好,甚至更好。

  ONE-PEACE是一个新的模型,在理解图像、声音和文字方面表现出色,无需从预训练模型开始,它在涉及视觉、音频和语言的任务中表现异常出色。它还具有一个独特的功能,可以找到它以前没有见过的不同类型数据之间的联系,其灵活的结构意味着它将来可以与更多类型的数据一起使用。

  量化可以降低模型中数字的精度,从而使它们在硬件中占用更少的空间。这在以前通常只用于推理。这项新的研究允许在普通硬件上微调650亿参数的模型。这是训练量化的一项突破。

  研究人员开发了一种名为mLongT5的强大工具,可以理解和翻译多种语言的长文本。在文本摘要和回答各种语言的问题等任务中,它的表现超过了其他类似工具。

  SuperAgent是一个强大的工具,简化了LLM(大型语言模型)代理的配置和部署过程。

  微软的GitHub笔记本比较了ChatGPT在更复杂任务上与开源AI模型的性能。该文档包含了代码和详细分析,提供了对每个模型的优势和劣势的深入理解,以细致入微地了解它们的能力。

  FastComposer是一种新方法,可以从文本快速创建个性化的多主题图像,避免了其他方法中耗时的精细调整。它不仅解决了多主题生成中的混合问题,还可以更快地生成不同风格、动作和背景的众多未见过的个体图像,而无需为新主题提供额外的存储空间。

  Yennie Jun的博客文章深入探讨了AI语言模型在对不同语言进行令牌化时可能面临的问题。令牌化是将文本分解为较小单位(令牌)的过程,在许多自然语言处理任务中是关键步骤。然而,令牌化并不总是简单明了,特别是对于具有与英语不同结构特征的语言。该文章探讨了这些挑战,并提供了潜在的解决方案,强调在AI开发中理解多语言的重要性。

  这项研究探讨了不同的 AI 模型在谈判游戏中扮演买方、卖方和评论家角色时,是否可以在没有人类帮助的情况下互相教导对方获得更好的交易。研究发现,某些模型可以从游戏中学习并改进谈判策略,但其成功程度因其扮演的角色和有效利用过去经验的能力而有所不同。

  PaLM 2是Google的最新语言模型,具有改进的多语言和推理能力,处理速度比之前的版本PaLM更快。尽管更快和更高效,它不仅保持了工作质量,还改进了在不同任务上的性能,而且经过设计以安全和负责任的方式,内置控制措施以防止滥用。

  LoopGPT是流行的Auto-GPT项目的重新实现,作为一个合适的Python包,具有模块化和可扩展性。

  通过Desku的AI增强自动化改变您的业务!使用共享收件箱轻松协作,并通过WhatsApp集成将一次性访客转化为重复客户。与Desku一起体验客户支持和客户体验的未来!

  利用语言处理模型的强大能力,新提出的VideoLLM系统将所有视频输入转化为一种可以更高效地进行分析的语言类型。通过成功在多个数据集上进行测试,VideoLLM证明它可以处理各种任务,这表明语言模型的推理能力可以有效地用于理解和分析视频内容。

  无缝地将ChatGPT等强大的语言模型集成到scikit-learn中,以增强文本分析任务。

  DB-GPT是一个实验性的开源项目,使用本地化的GPT大型模型与您的数据和环境进行交互。

  Zeda.io是一款由 AI 驱动的产品发现和战略平台,帮助产品团队发现对客户重要的问题,决定下一步的构建内容,并创建推动结果的战略。

  Flux.ai教程介绍了如何将AI应用于硬件设计,概述了将AI集成到设计过程中的潜在好处,如提高效率、准确性和创新,并提供了实施这些技术的实用指南。

  Betafi旨在提升您的Google Meet通话体验:一键捕捉重点要点,支持30种语言的转录,将笔记/剪辑带到Miro/FigJam,发现重复出现的趋势。

  Oracle已开始审查TikTok的源代码。这家总部位于美国的软件公司现在是美国用户数据的默认目的地。TikTok正在与爱尔兰和挪威建立欧洲本地托管计划的数据中心。该公司声称中国政府从未要求其提供美国用户数据,即使被要求,也不会提供这些信息。尽管面临法律问题,TikTok并未放慢其盈利推动的步伐。

  本文讨论了使用 AI 在多种语言上审核内容的挑战。文章认为当前的AI系统无法准确检测到所有语言中的有害内容,并且这可能会产生严重后果。文章最后呼吁进行更多的研究,以改善AI内容审核系统的准确性,并要求社交媒体公司更加透明地公开他们使用AI进行内容审核的方式。

  据报道,iOS 17 界面将显示诸如约会、天气和通知等信息。它将类似于其他公司的智能家居设备。苹果还计划对iPhone的钱包应用进行重大改进,增强其位置服务,推出专用的日记应用,并推出一项功能,使用户在FaceTime通话时可以与其他用户同步播放媒体。

  谷歌CEO Sundar Pichai发表的一篇专栏文章中,他讨论了谷歌如何负责任地构建AI,重点是制定规则、制定智能监管和促进国际合作。

  白宫周二表示,它将询问员工雇主如何使用 AI 监控他们,同时分配联邦对这项预计将改变工作性质的技术的投资。

  本文讨论了流氓AI的产生方式。作者认为,流氓AI系统最快的途径是,如果具备适当技术技能和手段的人有意构建AI系统,并以摧毁人类或明确设定某个部分人类为目标,那么流氓AI就会诞生。然而,即使制造它的人并不打算设计一个流氓AI,一系列更广泛且不太了解的情况也可能导致潜在的流氓AI的出现。

  谷歌正在使用AI提升洪水预测。通过整合各种数据来源,谷歌的模型可以预测洪水事件及其严重程度。这一预警系统有助于社区做好准备,潜在地挽救生命。

  作者因AI写作机器人的兴起而失去了一个有利可图的客户。尽管遇到了挫折,但作者将其视为追求新事业并与读者建立个人联系的机会。在AI的新世界中,大多数人都不得不重新发明自己。

  一段虚假的视频在网上流传,展示了五角大楼被爆炸摧毁的场景,这是由名为BigGAN的AI模型创建的。尽管看起来逼真,观众很快就发现了不一致之处,突显了对AI生成的深度伪造技术的担忧,以及它们可能引发恐慌或传播错误信息的潜力。

  纽约市教育局将解除对OpenAI的热门AI聊天机器人ChatGPT的禁令,此前该机器人因学生潜在滥用和作弊的担忧而被禁止使用。纽约市公立学校校长大卫·班克斯在一篇专栏文章中指出,最初的谨慎态度已经转变为探索该工具在支持学生和教师方面的潜力。未来,教育工作者将获得资源和成功的AI应用示例,以改进任务和教学。这一决定凸显了为准备未来就业市场的学生提供AI素养的日益重要性。

  周六,七国集团(G7)国家领导人呼吁制定和采用可信 AI 的国际技术标准。

  意大利周一拨款3000万欧元(3300万美元)用于提高失业人员的技能,以及那些工作可能最容易受到自动化和 AI 发展影响的工人。

  文章讨论了一种非常规的AI应用:进行复活术,即使用语言模型生成的文本与已故人士进行沟通。

  本活动招募由 Sota.ai 加速器发起,将围绕 AIGC 的技术前沿与产业落地,举办一系列线上与线下 Meetup 活动,现诚挚邀一批分享嘉宾参与到活动议题中来,招募信息如下:CQ9电子