“如果你不冒险去做你害怕的事情,你就永远不会成功。”

——————埃隆·马斯克

告别AI一本正经!Midjourney联手NYU解锁创意文本新维度,多样性飙升23%!
2025年3月30日 10:00

Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法,旨在显著提升语言模型生成创意文本的多样性,同时将质量损失控制在最低限度。这项发表在最新研究论文中的技术,核心在于将偏差指标引入人工智能的训练过程。其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。研究人员利用嵌入文本及其成对余弦距离来计算这些差异,从而为系统提供了一种理解文本变异性的数学框架。这种新的训练方法能够评估大型语言模型(LLM)响应之间的差异,从而增强输出的多样性。该培训方法评估 LLM 响应之间的差异以增强输出多样性。| 图片:Chung 等人初步测试结果令人鼓舞。采用这种新型训练方法的模型,其生成的文本多样性提高了23%,而根据 Reddit 的奖励系统评估,质量得分仅下降了5%。一个具体的测试案例清晰地展示了该方法的实际效果。当研究人员向标准 GPT-4o 模型发出提示亲爱的,你为什么发抖?你现在是国王了时,模型主要生成关于一位紧张的新统治者的故事。然而,经过改进的 Llama-3.1-8B 模型(尽管规模较小)却创作出了风格迥异的故事,涵盖了关于熊王子的黑暗幻想,以及水下的超自然传说等多种题材,展现出远超前者的创意广度。人类测试人员的反馈也支持了这些发现,他们认为这些文本在保持质量的同时,展现出了更丰富的多样性。值得注意的是,研究人员的测试对象是相对较旧的 GPT-4o 模型,而非成本更高但能生成更自然文本的新一代 GPT-4.5。研究数据表明,经过改进的模型在故事质量和多样性方面均优于其他模型。研究团队重点关注两种类型的多样性:语义变化(不同的故事内容和情节)以及文体变化(听起来像是出自不同作者的写作风格)。他们为每种类型开发了特定的版本,但实验结果表明,将两者结合使用能够获得最佳效果。数据显示,修改后的模型在故事质量和多样性方面均优于其他模型。| 图片:Chung 等人。在研究过程中,该团队利用了 Reddit 社区 r/WritingPrompts 中超过10万对提示-响应数据。他们发现,每个提示仅需四个不同的响应,即可显著提升模型的多样性。此外,该系统还可以通过使用精心挑选的训练样本或为不同的响应设置最低质量标准来维持输出质量,这使其在提升输出多样性方面比其他方法更具灵活性。尽管前景可期,但仍有一些问题需要进一步探索。研究人员尚未验证他们的方法是否适用于创意写作以外的领域,例如技术文档和摘要等可能需要不同的处理方式。该技术在许多大型模型使用的在线训练环境中的有效性也尚未得到充分测试。此外,用于衡量质量的 Reddit 点赞数系统本身也存在局限性。虽然点赞数可以提供一些关于文本质量的参考,但它们忽略了技术准确性、一致性和专业写作标准等重要因素,这表明未来可能需要更全面的评估方法。即便存在这些未决问题,这项新技术仍有望彻底改变大型语言模型处理创意写作任务的方式,因为目前的模型经常陷入重复性的模式。研究人员表示,他们将在 GitHub 上公开分享他们的代码,以供其他研究人员和开发者借鉴。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16716

宫崎骏怒了?ChatGPT吉卜力风潮惹版权争议,OpenAI或面临法律挑战!
2025年3月29日 04:00

OpenAI 的当红 AI 聊天机器人 ChatGPT 本周因一项突如其来的用户趋势而成为焦点:无数用户涌入,争相生成酷似日本动画传奇工作室吉卜力作品风格的图像。这场模仿之风迅速蔓延,甚至连 OpenAI 首席执行官 Sam Altman 也在社交媒体上戏称自己变成了吉卜力风格的 twink。然而,这场看似无伤大雅的流行趋势很快遭遇急转弯。OpenAI 开始采取行动遏制这一现象,实施了一系列令人费解的调整,如今,用户生成吉卜力风格图像的请求经常遭到拒绝。这场病毒式的传播以及 OpenAI 混乱的应对,再次点燃了围绕版权和生成式人工智能使用的激烈争论。批评者认为,这种行为直接侵蚀了包括吉卜力工作室极具才华的动画师在内的人类艺术家和出版商的劳动成果。据 Showtime 电视台前总法律顾问、人工智能专家 Rob Rosenberg 分析,吉卜力工作室实际上可能具备对 OpenAI 采取法律行动的理由。他表示,虽然这是否构成充分的法律依据是一个复杂的问题,但吉卜力可能有能力声称 OpenAI 违反了《兰哈姆法案》,该法案为虚假广告、商标侵权和不正当竞争相关的索赔提供了法律依据。Rosenberg 认为,吉卜力可以辩称,通过允许用户将照片转换为吉卜力风格,OpenAI 正在损害吉卜力商标的商誉,未经授权使用了吉卜力可识别的独特风格,并可能导致消费者混淆,误认为该功能得到了吉卜力工作室的认可或授权。此外,他还补充说,OpenAI 还可能因在其大型语言模型上训练了吉卜力工作室的版权作品而面临诉讼。事实上,OpenAI 已经因其在互联网上抓取包括大量受版权保护材料在内的数据用于模型训练的方式,而面临多起法律诉讼。就在本周,一名联邦法官驳回了 OpenAI 要求驳回《纽约时报》提起的版权诉讼的请求。该报于2023年底指控 OpenAI 未经许可使用其新闻材料训练 AI 模型,侵犯了其版权。马克·扎克伯格的 Meta 也面临类似的指控,被指非法下载盗版书籍以训练其人工智能模型。然而,到目前为止,还没有明确的法律先例来裁定 OpenAI 是否违反了美国版权法。OpenAI 坚称根据版权法,训练他们的模型属于合理使用,因此不构成侵权。这一合理使用原则一直是围绕 OpenAI 等人工智能公司是否侵犯版权的核心争议点。目前尚不清楚吉卜力工作室是否会采取法律行动。该公司周五向日本新闻媒体 NHK 表示,网上流传的一份声称是该工作室发出的停止侵权通知书的法律文件是伪造的。但 Rosenberg 警告称,由于大多数法院尚未对类似的版权主张的效力作出裁决,因此尚不清楚这些诉讼是否会成功。他认为,如果 OpenAI 将其平台宣传为消费者可以将照片转换为吉卜力风格动画的地方,这将更有力地支持法院裁定 OpenAI 的行为违反了《兰哈姆法案》。Rosenberg 预测,除非法院一致裁定支持 OpenAI,认定使用受版权保护的材料训练人工智能模型确实属于合理使用,否则未来可能会出现这样一种体系:人工智能开发者需要对版权持有者进行补偿,并在其内容被用于生产输出时给予他们署名。除了潜在的版权问题,OpenAI 的这一功能还可能剥夺吉卜力工作室其他的盈利机会。Rosenberg 指出,如果吉卜力工作室未来计划推出自己的工具,让粉丝们将照片转换为其标志性风格,那么 OpenAI 的这项功能实际上已经抢占了这个市场。更糟糕的是,这项技术甚至可能导致人们以吉卜力风格制作完整的动画项目,并错误地将其宣传为吉卜力工作室的真实作品,模糊了致敬和彻底歪曲之间的界限。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16715

98%授权通过率!前医生创办Taxo,用透明AI推理重塑医疗效率,获投500万!
2025年3月29日 04:00

曾饱受医疗文书工作困扰的英国医生艾哈迈德·克尔万,在转行成为企业家后,创立了名为 Taxo 的初创公司。该公司致力于利用人工智能技术,大幅减轻医疗保健领域长期存在的复杂管理负担。Taxo 近日宣布完成500万美元种子轮融资,由 Y Combinator、General Catalyst 和 Character Capital 联合领投,显示出投资者对这一创新解决方案的浓厚兴趣。克尔万表示,在他作为医生的职业生涯初期,繁琐的文书工作令他震惊,有时他每天仅能花费三个小时照料病人,其余时间都被保险索赔等行政事务占据。如今,市场上涌现出数十乃至数百家初创公司,竞相利用人工智能提高医疗效率,例如专注于医疗笔记的 Abridge 和 AI 助手 Ambience 等。而 Taxo 的独特之处在于其核心人工智能推理引擎。图源备注:图片由AI生成,图片授权服务商Midjourney据克尔万介绍,Taxo 的推理引擎能够向用户透明地解释其决策过程,这对于赢得医生等专业人士的信任至关重要。他指出,随着去年底推理模型通过公开阐述逻辑而成为人工智能领域的主流趋势,Taxo 也在其系统中融入了这一技术,有助于显著减少 AI 幻觉,并已将事先授权的批准率提高至98%,远高于行业约80% 的平均水平。Taxo 的推理引擎并非从零开始构建,而是在 OpenAI 和 Anthropic 等现有大型语言模型的基础上,增加了一个医疗专用层。该公司强调,该系统利用了难以获取的专业医疗数据进行训练,这为 Taxo 构建了较高的竞争壁垒。我们不想每次 OpenAI 推出新模型时都被轻易超越,克尔万对表示。尽管人工智能推理趋势尚处于早期阶段,直至中国初创公司 DeepSeek 的崛起才开始受到广泛关注,但投资者对 Taxo 的青睐表明,这项技术有望在基础人工智能公司之外实现更广泛的应用。Taxo 成立于去年,总部位于旧金山。据 TechCrunch 报道,该公司在成立仅六个月后,年度经常性收入就已超过100万美元。目前,Taxo 为大约15家客户提供服务,客户类型涵盖诊所到政府服务机构。克尔万坦言,在 ChatGPT 发布后,医生们对其使用持谨慎态度,这主要是因为他们无法追踪 AI 提出具体建议的原因和依据。他希望 Taxo 能够改变这种状况。你可以准确地看到我们从哪里获得这些信息以及为什么提供这些信息,他强调,Taxo 旨在通过透明的推理引擎赢得医疗专业人士的信任,从而真正解放医生,让他们能够将更多精力投入到患者护理中。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16714

OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红,争议内容限制放宽引关注
2025年3月29日 04:00

OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红,争议内容限制放宽引关注本周,OpenAI 在 ChatGPT 中推出全新图像生成器,其生成吉卜力风格图像的能力迅速走红。该生成器基于 GPT-4o,显著提升了 ChatGPT 的图片编辑、文本渲染和空间表示功能。然而,更引人注目的是 OpenAI 对内容审核政策的重大调整。新政策允许 ChatGPT 根据用户要求生成描绘公众人物、仇恨符号和种族特征的图像,这与此前严格限制争议性内容的做法大相径庭。OpenAI 模型行为负责人 Joanne Jang 表示,公司正从全面拒绝转向更精准的方法,旨在防止现实世界的伤害,并强调在学习的同时适应。OpenAI 此举被视为其解除ChatGPT 审查的更大计划的一部分,旨在让模型处理更多请求,提供多样化视角。根据新规,ChatGPT 现在可以生成和修改特朗普、马斯克等公众人物的图像。OpenAI 认为不应成为决定谁可以被生成的仲裁者,并为用户提供了选择退出的机制。此外,在教育或中性环境下,ChatGPT 甚至可以生成纳粹标志等仇恨符号,前提是不明确赞扬或支持极端主义。对于以往会被拒绝的涉及身体特征的请求,新模型也已放宽限制。同时,ChatGPT 还能模仿皮克斯或吉卜力等工作室的风格,但仍限制模仿在世艺术家。尽管如此,OpenAI 并非完全放开滥用,GPT-4o 在生成儿童图像方面设置了更严格的保障措施。但此次内容审核政策的显著变化,正值保守派长期批评硅谷公司人工智能审查之际。此前,谷歌的 Gemini 图像生成器就曾因生成不准确的多种族历史人物图像而引发争议。共和党众议员吉姆·乔丹已就人工智能内容审核问题向 OpenAI 等科技巨头发出质询。OpenAI 否认政策变化出于政治动机,称其反映了长期以来给予用户更多控制权的信念,且技术已足够成熟处理敏感话题。考虑到未来可能面临的监管审查,OpenAI 此举时机敏感。Meta 和 X 等平台也采取了类似策略,允许更多有争议内容发布。尽管 ChatGPT 新的图像生成器目前主要用于创作娱乐性的吉卜力风格图片,但其内容审核政策的转变可能带来更广泛的影响,并可能使 OpenAI 在回应敏感问题时面临新的挑战。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16713

马斯克重磅出击!xAI与X正式合并,AI帝国版图再扩张
2025年3月29日 04:00

全球科技巨头埃隆·马斯克今日通过旗下社交媒体平台X发布重磅消息,证实其人工智能初创公司xAI已与X完成合并。本次交易采取全股票形式,使得xAI的估值飙升至 800 亿美元,远超X此前 330 亿美元的估值。马斯克在X上发文,掷地有声地表示:xAI和X的命运紧密相连。今天,我们正式迈出了整合数据、模型、算力、分发渠道以及人才的关键一步。他强调,此次战略合并旨在通过融合xAI尖端AI技术与X的庞大用户基础,释放巨大潜力。由于xAI和X均由马斯克控股,本次合并实质上为股权置换,X的现有投资者将获得相应比例的xAI股份。值得注意的是,两家公司拥有众多共同的重量级投资者,包括安德森·霍洛维茨基金、红杉资本、富达投资、Vy Capital以及沙特王国控股公司等。身兼特斯拉和SpaceX掌门人的马斯克,于 2022 年底斥资约 440 亿美元收购了当时的推特,并进行了大刀阔斧的成本削减,随后将其更名为X。X平台现任首席执行官琳达·亚卡里诺在合并公告发布后发文称:未来前景无限光明。事实上,X与xAI的合作早有迹象。X平台已集成了xAI旗下备受关注的智能聊天机器人Grok,供用户使用。此外,xAI于 2024 年 6 月宣布将在田纳西州孟菲斯市建造名为巨像(Colossus)的超级计算机,专门用于训练Grok。截至同年 9 月,巨像的部分机组已投入运行。值得关注的是,资本市场对xAI的估值呈现快速增长态势: 2024 年融资轮估值约为 500 亿美元,近期更传出正以 750 亿美元估值进行新一轮融资。作为对比,OpenAI今年 2 月完成融资时的估值为 2600 亿美元,而Anthropic本月的最新估值则为 615 亿美元。此次xAI与X的合并,无疑将进一步提升马斯克在人工智能领域的竞争力,其AI帝国版图正在加速扩张。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16712

MIT 与哈佛联合推出 Lyra:一种高效的生物序列建模新方法
2025年3月28日 10:00

在生物序列建模领域,深度学习技术的进步令人瞩目,但高昂的计算需求和对大数据集的依赖让许多研究者感到困扰。最近,麻省理工学院(MIT)、哈佛大学和卡内基梅隆大学的研究团队推出了一种名为 Lyra 的新型生物序列建模方法。这种方法不仅参数显著减少到仅有传统模型的12万分之一,而且能够在短短两小时内使用两块 GPU 进行训练,极大地提升了模型的效率。Lyra 的设计灵感来源于生物学中的上位效应(即序列内突变间的相互作用),它通过一个次二次架构来有效理解生物序列与其功能之间的关系。这种新模型在100多个生物任务中展现出色的性能,包括蛋白质适应度预测、RNA 功能分析及 CRISPR 设计等领域,甚至在某些关键应用中达到了当前技术的最佳性能(SOTA)。与传统的卷积神经网络(CNN)和 Transformer 模型相比,Lyra 的推理速度提升了64.18倍,同时大幅降低了参数需求。这得益于其创新的混合模型结构,Lyra 结合了状态空间模型(SSM)和投影门控卷积(PGC)来捕获生物序列中的局部和全局依赖关系。SSM 通过快速傅里叶变换(FFT)高效建模全局关系,而 PGC 则专注于提取局部特征,二者的结合让 Lyra 在计算效率和可解释性之间达成了良好平衡。Lyra 的高效性不仅能够推动基础生物研究的进展,也可能在治疗开发、病原体监测以及生物制造等实际应用中发挥重要作用。研究团队希望,通过 Lyra,更多的研究者能够在资源有限的情况下进行复杂的生物序列建模,从而加速生物科学的探索。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16711

首个AI心理健康聊天机器人 Therabot 试验显示显著疗效
2025年3月28日 10:00

在现代社会中,心理健康问题日益受到关注,越来越多的人开始求科技的帮助。达特茅斯学院的研究人员最近开展了一项关于 AI 心理健康聊天机器人 Therabot 的试验,旨在评估其在改善心理健康方面的有效性。此次研究涉及106名被诊断为重度抑郁症、广泛性焦虑症和饮食失调症的参与者,试验为期四周。图源备注:图片由AI生成,图片授权服务商MidjourneyTherabot 与其他聊天机器人如 ChatGPT 不同,它主动与用户互动,提出情绪和情感相关的问题,鼓励用户进行回答和深入对话。研究发现,在试验结束时,参与者的症状缓解情况相当可观。特别是抑郁症患者报告平均症状减轻了51%,情绪和整体幸福感都有显著提升;而广泛性焦虑症患者的症状平均减轻31%,许多人从中度焦虑降至轻度,或甚至降至诊断阈值以下。对于饮食失调症患者,身体形象的改善则平均达到19%。研究表明,Therabot 提供的支持与传统治疗效果相当,尤其是在面对治疗资源短缺的情况下。研究团队的成员表示,尽管面对面治疗无法替代,但 AI 聊天机器人可以作为一种重要的补充,尤其是在很多人无法及时获得专业心理帮助的情况下。目前,在美国,约有1600名需要支持的临床患者对应一名治疗师,需求远远超过供给。Therabot 的设计经过了心理学家和精神病学家的专业咨询,旨在为用户提供有针对性的心理健康支持。研究中还设定了保护机制,以识别有自残风险的用户,并提供紧急护理链接。参与者在试验期间与 Therabot 进行了约六小时的交流,这相当于与治疗师进行八次治疗。用户在使用 Therabot 的过程中逐渐建立了信任和情感联系,许多人反映他们更愿意与这个不具评判性的聊天机器人分享自己的感受。虽然这项研究的结果令人鼓舞,但研究者也强调,不能过于依赖 AI 技术,仍需谨慎对待其在心理健康领域的应用风险。研究结果发表在《新英格兰医学杂志》上,为未来 AI 在心理健康支持方面的应用提供了新的思路。划重点: 研究显示,AI 聊天机器人 Therabot 对抑郁症和焦虑症患者有显著疗效,症状缓解达到51% 和31%。 Therabot 通过主动互动和情感支持帮助用户建立信任,许多用户更愿意分享感受。 尽管成果令人振奋,但研究者提醒不要过度依赖 AI 技术,仍需谨慎应对潜在风险。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16710

腾讯元宝已支持多达36种文件格式的解析与处理
2025年3月28日 10:00

3月28日,腾讯元宝宣布了一项重大更新,其AI助手现在能够支持多达36种文件格式的解析与处理。这一更新进一步拓展了元宝在工作和学习场景中的应用能力,为用户提供了更加便捷和高效的服务。元宝作为腾讯推出的AI助手,一直以来都致力于通过强大的模型能力帮助用户提升效率。此次更新后,用户可以直接上传包括Word、PDF、Excel在内的常见文档格式,以及.py、.java、.json等开发文件。元宝不仅能够理解这些文件的内容,还能根据用户的需求完成代码解读、审查、定位Bug、提供修改建议以及优化语法等操作。此外,元宝还支持将代码转换成另一种语言,例如将Python代码翻译成JavaScript,为开发者提供了极大的便利。此次更新是元宝继接入DeepSeek V3-0324最新版和推出HTML代码实时预览功能之后,本周面向开发场景的第三次功能迭代。元宝的混元和DeepSeek两大模型都具备代码能力,支持多种主流编程语言,覆盖前端开发、脚本自动化、数据处理等场景,适用于日常开发、代码评审、文档校对、学习训练等多类需求。用户可以通过简单地上传文件,让元宝完成一系列复杂的操作。例如,在开发场景中,用户只需上传项目中的Python文件,元宝就能指出潜在问题并提供修改方案。此外,元宝还支持直接拖拽上传文件,进一步简化了操作流程。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16709

英伟达计划收购贾扬清创办的AI初创公司Lepton AI 推动云计算布局
2025年3月28日 10:00

根据外媒《信息》的报道,英伟达即将收购知名 AI 创业公司 Lepton AI,交易金额预计在数亿美元。这一举措标志着英伟达正积极进军云计算和企业软件市场,力图与亚马逊、谷歌等主要云服务商展开竞争。Lepton AI 成立于两年前,由著名科学家贾扬清及其团队创立。该公司专注于为 AI 时代构建新型基础设施,致力于简化 AI 模型的构建与部署。与许多创业公司不同,Lepton AI 并不直接训练大型模型,而是提供所需的基础设施,帮助开发者高效地进行 AI 应用开发。Lepton AI 的核心产品包括 Python SDK 和云计算平台。通过 Python SDK,开发者可以使用极少的代码便轻松部署 AI 模型,无需深入复杂的技术细节。完成部署后,开发者只需简单的命令就能快速实现应用功能,极大地降低了技术门槛。其云平台则提供按需的计算资源,包括 CPU 和 GPU 等,开发者可以通过云服务轻松托管 AI 应用,免去自行管理服务器的麻烦。值得一提的是,贾扬清是一位在 AI 领域备受关注的科学家,曾在多个知名机构任职,并参与了多个重要项目的开发。在他的带领下,Lepton AI 的目标是解决 AI 基础设施层的速度、成本和质量问题,致力于让更多的开发者和企业能够更便捷地使用 AI 技术。随着这笔交易的接近,行业内外对贾扬清和 Lepton AI 的未来充满期待。英伟达将如何将 Lepton AI 的技术融入其云基础设施中,将是一个值得关注的焦点。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16708

Manus正式推出付费计划,Manus Starter套餐定价39美元/月
2025年3月28日 10:00

在人工智能服务日益竞争的背景下,Manus近日宣布推出其首个付费订阅模式,标志着该平台从免费测试阶段向商业化运营的重要转型。公司推出了两个不同级别的订阅计划:Starter和Pro,同时保留了1,000积分的免费额度,为不同需求的用户提供了灵活选择。Manus Starter套餐定价39美元/月,提供3,900月度积分,允许同时运行两个任务,并赋予用户专属资源、扩展上下文长度以及高峰时段优先访问的权限。而Pro套餐则以199美元/月的价格,为用户提供19,900月度积分,支持同时运行五个任务,并额外开放高投入模式和测试功能。在积分使用规则上,Manus设计了较为灵活的机制。月度积分将在每个订阅周期结束时自动重置,未使用积分不结转,但免费积分和附加积分将永不过期。积分消耗将按照月度积分、附加积分和免费积分的顺序进行。这一定价策略不仅反映了Manus对用户差异化需求的精准把握,也为平台的持续发展建立了稳定的收入模式。在AI服务日益走向商业化的今天,Manus的这一举措被业内视为人工智能服务市场重要的里程碑,预示着这一领域将迎来更加成熟和多元化的发展阶段。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16707

开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏
2025年3月28日 10:00

近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。这一创新的设计让 YuE 在音乐生成的质量上达到了前所未有的高度,甚至与市场上著名的闭源音乐生成工具 Suno 和 Udio 相抗衡。YuE 可以同时生成专业级的歌声和伴奏,实现了音乐创作的端到端生成。研究团队在 YuE 中引入了 双轨版下一 token 预测 策略,将人声和伴奏轨道分开建模,确保了音乐创作中的细腻度和一致性。这一方法不仅提升了音质,还显著减少了内容重构过程中的信息损失。此外,YuE 的 结构化渐进生成 技术让歌曲的主副歌段落能够在同一上下文中交替进行,进一步提高了歌曲的连贯性。为了避免抄袭,YuE 还开发了独特的音乐上下文学习技术,这让模型在创作时能够从已有的音乐片段中学习而不重复。这一创新不仅提高了模型的音乐性,还增强了其创作的独特性。最终,YuE 在多项评测中展现出卓越的表现,成功赢得了用户的好评。随着 YuE 的发布,音乐创作的未来将更加充满可能性。无论你是专业音乐人还是业余爱好者,都可以在这个平台上体验 AI 带来的音乐创作乐趣。项目地址:https://github.com/multimodal-art-projection/YuE

信息源:AIBase 来源:https://www.aibase.com/zh/news/16705

微软CEO内部发言看好DeepSeek 重塑AI协作与创新范式
2025年3月28日 07:00

在最近的员工大会上,微软首席执行官萨蒂亚·纳德拉对DeepSeek的评价引人注目,透露出公司在人工智能领域的战略深思。纳德拉被DeepSeek200人团队的协同能力深深打动,他认为这不仅仅是一个研究项目,更是一个成功转化为市场领先产品的典范。CoreAI负责人Jay Parikh进一步强调,这个小型团队的成就促使微软重新审视内部协作模式。\图源备注:图片由AI生成,图片授权服务商Midjourney微软并未将鸡蛋放在一个篮子里。继上月发布专注游戏的Muse模型后,公司正积极构建自身AI生态系统。纳德拉强调,团队的目标是将基础研究转化为Copilot产品线中的突破性功能。除模型开发外,微软还计划投资800亿美元于数据中心,意在为客户提供全面的AI工作负载解决方案。首席财务官Amy Hood透露,公司近3000亿美元的合同收入将支撑这一宏大计划。这一系列举措表明,微软正从OpenAI的投资者转变为AI领域的主动创新者,致力于建立独特的技术生态系统。

信息源:AIBase 来源:https://www.aibase.com/zh/news/16704