AIGC开放社区

【AI Agent极限挑战赛】三大赛题揭晓

；构建对应的工作流，来满足Agent自动化的调用执行需求。四、赛题数据包下载a.简历数据，打开后右上角下载即可：赛题-简历数据.zip

8月22日上午 8:06

每天免费100万token，GPT-4o新增微调功能

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！OpenAI向所有开发者推出GPT-4o数据微调功能，可以使用自己的数据打造准确率、输出模式更好的个性化ChatGPT助手。例如，韩国最大电信运营商SK

8月21日上午 8:03

其他

AI生成未来 | 2024第二届拯救者杯OPENAIGC开发者大赛圆满收官！

8月17日，由AIGC开放社区携手联想拯救者、英特尔共同主办的“2024拯救者杯OPENAIGC开发者大赛”在上海中庚聚龙酒店完美收官。这场比赛吸引了来自全国各地的2300多名开发者，组成554支队伍参赛，最终当日179支队伍在决赛中角逐AI桂冠。在三大赛道中，“AI

8月20日上午 8:27

其他

拯救者杯OPENAIGC开发者大赛今日迎来决赛，现场179支参赛团队角逐AI桂冠

2024拯救者杯OPENAIGC开发者大赛于今日（8月17日）在上海中庚聚龙酒店迎来精彩决赛！创未来AI应用赛拯救姬AI创意赛AI

8月17日上午 7:16

其他

倒计时1天 | 拯救者杯OPENAIGC开发者大赛迎来巅峰对决！

由AIGC开放社区、联想拯救者、英特尔携手主办的“AI生成未来·第二届拯救者杯OPENAIGC开发者大赛”决赛于8月17日全天在上海中庚聚龙酒店隆重举行。决赛现场设有三大赛道，“创未来·AI应用赛

8月16日上午 8:40

其他

超强实体ChatGPT机器人：语音推理、视觉识别，“终结者”来啦！

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！Figure.AI联合创始人Brett

8月7日上午 9:02

其他

马斯克再次起诉，OpenAI、Sam Altman

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！8月6日，美国加利福尼亚州北区地方法院受理了新的起诉案件，马斯克以违反联邦法律、欺诈、违反信托义务、不正当竞争等理由，起诉OpenAI和其联合创始人Sam

8月6日上午 9:24

其他

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！随着智能手表、健身追踪器等可穿戴设备的普及，使得我们能持续监测健康状况，包括睡眠质量、日常活动、心率和血压等。但如何有效利用这些数据，并从中找出一些健康问题，对于普通用户来说却很难。所以，谷歌的研究人员在Gemini模型的基础之上，微调出了专用于个人健康的大语言模型PH-LLM。用户通过将健康数据与PH-LLM相结合，就能快速获取个性化健康建议、日常疾病问答、健康报告预测等专家级医疗咨询服务。论文地址：https://arxiv.org/abs/2406.06474数据整合PH-LLM会先通过数据整合模块，将来自智能手表、健身追踪器等智能设备的健康数据汇集起来，构建一个统一的数据库。在数据整合的过程还涉及了数据的清洗和转换。搜集到的原始健康数据可能包含噪声、缺失值或异常值，这些都可能影响PH-LLM分析结果的准确性。数据清洗则是识别并处理这些问题，确保数据的质量和可靠性。例如，对于缺失的数据，可以通过插值方法进行估计；对于异常值，则可以通过统计方法进行识别和处理。数据转换是将不同格式和结构的数据转换为统一格式的过程。这通常涉及到数据类型的转换、时间戳的统一、度量单位的标准化等。数据整合则是将转换后的数据合并到一个数据集中，形成一个全面的个人健康档案。这一步骤需要考虑数据的关联性和一致性，确保不同数据源之间的信息能够正确地关联起来。上下文理解在获取用户的健康数据后，上下文理解模块则主要用于分析，从而将孤立的数据点转化为有意义的健康见解和建议。数据的深度分析是上下文理解模块的核心，不仅是对数据的简单汇总，而是需要理解数据背后的复杂关系和模式。例如，一个人的心率在不同的活动状态下可能有不同的含义。在安静休息时，心率较低可能表示放松和健康；而在剧烈运动后，心率的升高则是正常的生理反应。因此，上下文理解模块需要能够识别和解释这些数据的波动，从而提供更准确的健康见解。时间是分析个人健康数据中的一个重要维度，在一天中不同时间段的变化，模型可以识别出用户的日常生活习惯，包括睡眠周期、锻炼时间等，并评估这些习惯对健康的影响。例如，一个用户可能在晚上10点到早上6点之间有稳定的睡眠模式，而在周末则可能睡得更晚。这种模式的变化可能会影响用户的健康周期表现。不过在处理个人健康数据时隐私和安全至关重要，研究人员表示，PH-LLM在处理健康数据时，会进行脱敏、加密存储和安全传输等保护措施。同时允许用户对自己的数据进行完全控制和管理，并将数据的处理流程进行透明化。专家知识集成为了进一步增强PH-LLM分析数据的准确性和专业性，研究人员将多个高质量的医学文献、临床指南、健康数据集以及临床专家的经验集成在其中，并通过知识提取功能来获取，疾病的定义、症状、诊断标准、治疗建议以及预防措施等专业知识。在获取专业医疗知识后，下一步是将其融合到模型的推理过程中，让模型能够使用这些知识来解释个人健康数据，并生成相关的见解和建议。例如，如果一个用户的睡眠数据表明他们经常在夜间醒来，模型可以利用睡眠医学的知识来推断可能的原因，并提供改善睡眠质量的建议。这种知识融合和推理的能力是PH-LLM提供个性化健康建议的关键。为了确保模型生成的建议的准确性和有效性，研究人员还与一些专业的医疗人员合作，对PH-LLM输出的内容进行综合评估，以验证其提供的健康分析、建议是否与现有的临床实践一致论文。本文素材来源PH-LLM，如有侵权请联系删除END

7月21日上午 8:18

其他

谷歌推出通用视频模型：能精准分类、定位、检索等

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！谷歌的研究人员推出了通用视频模型VideoPrism，可以用于视频领域的多种任务，例如，内容分类、定位、检索、字幕和回答等。VideoPrism能拥有如此强的泛化能力，主要是使用了3600万段高质量的视频-字幕,以及5.82亿段带有噪声平行文本(如ASR文字转录、生成字幕等)的庞大预训练视频数据。为了测试VideoPrism的通用性能，研究人员在33个视频理解基准测试集上,涵盖4大类任务通用视频理解、视频-文本检索、视频字幕生成和问答进行了综合测试。结果显示，VideoPrism在30个基准测试上取得了最佳成绩,在通用视频分类和定位任务上,VideoPrism-g比目前最先进的视频模型VidepMAE-v2-g平均提升了22%的精准度。论文地址：https://arxiv.org/abs/2402.13217VideoPrism架构简单介绍VideoPrism使用了卷积神经网络来对视频帧进行特征提取。这些卷积神经网络由多个卷积层和池化层组成，可以精准捕捉视频中的空间信息。再通过这些卷积操作，使每个视频帧都被转换为一个高维的特征向量。VideoPrism还使用了Transformer架构中的自注意力机制，用于对视频中不同时间步的特征进行建模。自注意力机制能够学习到每个时间步之间的依赖关系，从而更好地捕捉视频中的时序信息，帮助VideoPrism对视频中不同时间步的特征进行加权组合，得到更具表征性的视频表示。除了卷积和自注意力，VideoPrism还采用了残差连接来促进信息的流动。残差连接可以将原始的视频特征与经过卷积和自注意力处理后的特征进行相加，从而保留了原始特征的信息，并且能够有效地缓解梯度消失问题。此外，VideoPrism还应用了层归一化（Layer

7月14日上午 7:25

其他

谷歌推出全新模型，将Transformer与NAR相结合

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！Transformer架构的出现极大推动了大模型的技术创新，诞生出了ChatGPT、Coplit、讯飞星火、文心一言等一系列生成式AI产品。虽然Transformer在自然语言理解任务上表现很好,但在算法推理方面有严重的缺陷。例如，当面临超出训练数据分布的输入时,其泛化能力会急剧下降。这主要是因为它们的自回归性质和掩蔽注意力机制,不符合算法输出的逻辑顺序。而神经算法推理(NAR)

7月8日上午 7:50

其他

Datawhale联合发起第二届OPENAIGC开发者大赛，邀请500支顶尖高校、企业的AI开发者队伍共同参与！

在全球科技迅猛发展的今天，人工智能（AI）技术作为推动社会进步的重要动力，逐渐渗透到各行各业，带来了前所未有的变革。Datawhale始终致力于构建一个纯粹的学习圈子，帮助学习者更好地成长。近日，由Datawhale联合AIGC开放社区、联想拯救者、英特尔、微软Reactor等单位共同发起的OPENAIGC开发者大赛（https://2024.aigcopen.com/）正在邀请参赛报名中。欢迎来自高校的同学们，以及来自企业和创业团队的伙伴报名参赛！有机会获得超过12万奖品，来自微软、AWS等技术专家培训、技术指导，100+国内AI投资基金对接路演资格等奖励内容。Datawhale将在技术资源共享、赛题设计和技术评审等方面发挥关键作用。Datawhale将通过深入的行业分析和技术研究，辅助赛题设计，并提供专业建议，以确保赛题具有挑战性和创新性。Datawhale社区代表将作为导师全程参与，凭借深厚的技术积累和丰富的实战经验，提供专业的指导和建议，并将在总决赛参与项目的评审工作。Datawhale诚邀来自高校的同学、以及产业界的开发者伙伴们积极参赛，期待在这场竞赛中涌现出更多杰出的创新方案和人才。大赛官网链接&报名：https://2024.aigcopen.com/END

7月2日上午 7:42

其他

谷歌、Anthropic推出创新神经压缩Equal-Info Windows

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！谷歌DeepMind和著名大模型平台Anthropic的研究人员联合推出了创新神经压缩方法——Equal-Info

6月29日上午 8:02

其他

谷歌推出创新方法：通过自然文本提示，快速训练视觉模型

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！目前，计算机视觉的应用已经渗透到了多个行业,从内容审核、交通安检到野生动物保护等。但主视觉是集中在狗、猫、汽车等客观分类上，对于情绪预测、美学评估等人性化内容较难，需要人工来进行数据标注。如果使用最近推出的“敏捷建模”来训练一个微小视觉模型，最少需要人工对2000张图像进行数据标注，整个流程大概耗费30分钟且无聊枯燥。谷歌和密苏里大学的研究人员推出了一种高效的视觉模型训练方法——Modeling

6月26日上午 8:55

其他

火热报名中！AI Agent智能体开发大赛邀你现场Battle！

Agent极限挑战·现场赛，是一场技术比拼，也是一次智慧的碰撞。准备好与各路AI极客同台竞技，展现你的开发天赋，迎接这一令人兴奋的现场Battle吧！END

6月25日上午 9:17

其他

脑洞大开！用大模型开卡车，还融了2亿美元

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！物理生成式AI驾驶平台Waabi在官网宣布获得2亿美元，本次由英伟达（NVIDIA）、沃尔沃、保时捷、Uber、Khosla等全球知名企业投资。Waabi仅成立3年便获得4级自主驾驶权限，主要是借助了ChatGPT等生成式AI风口，将其融合在自动驾驶中突破了很多重大技术难点，将在2025年推出无人干预的全自动化运输卡车。Waabi开发了一个端到端的大模型Copilot4D，可以模拟人类的智力、推理和驾驶习惯。相比传统的自动化驾驶方案所需要的训练数据和算力资源更少，在安全、环境侦测方面却有巨大提升，这也是全球为数不多将生成式AI与自动化驾驶相结合的案例之一。其实，Waabi起初是一家自动化驾驶平台，但看到全球生成式AI风口越刮越大并且已经进入商业化落地阶段。所以，在今年3月18日官宣与英伟达进行深度技术合作，将NVIDIA

6月24日上午 9:39

其他

美国发布新拟议规则，禁止在中国投资AI、半导体、量子计算

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月22日，美国财政部官网消息，发布了一项执行拜登总统令的提案通知（NPRM），旨在实施2023年8月9日签署的第14105号行政命令——境外投资令。此提案通知是在财政部去年8月发布的预先提案通知（ANPRM）基础之上进行了全面强化，包括拟议规则的全貌、意图、并公开征求公众意见。如果有异议，可以在8月4日之前提出意见。根据详细内容显示，中国香港、澳门和大陆成为主要关注对象，并禁止美国企业进行AI、半导体和微电子、量子计算三项投资。AI、半导体和微电子、量子计算成为本次重点禁止的三个投资对象。并指出，美国投资除了资本之外，还会带来管理方法、人才网络、市场准入等一些列好处。AI：AI在自动化决策、模式识别和预测分析等领域具有巨大应用潜力，这些能力在军事现代化、网络战和机器人技术中尤为重要。美国政府的禁令可能会限制对那些开发具有国家安全风险应用的AI系统的投资，特别是那些设计用于军事、政府情报或大规模监控目的的AI系统。此外，还可能要求美国人士在进行涉及AI系统的交易时向财政部进行通报。半导体和微电子：美国政府担忧特定外国实体通过美国的对外投资加速先进集成电路上的设计、生产及性能提升技术。此类技术对军事现代化至关重要，可显著提高军事决策的速度与准确性，以及后勤规划的能力。拟议规则针对中国因此，财政部正在考虑实施禁令，阻止美国个人参与涉及某些先进半导体与微电子技术及产品的交易，并考虑对其他技术及产品要求通知机制。这涵盖了从并购、私募股权到风险投资等多种形式的股权收购，以及新建绿地项目、合资企业及特定债务融资交易。此外，针对涉及超级计算机的交易也将受到审查，因为这类系统依赖于先进集成电路上的操作，其安装或销售可能需要事先通知。量子计算：该技术有望在加密、通信和传感等方面引发革命性的变化。美国政府特别关注那些可能威胁到现有加密和网络安全控制的量子信息技术和产品。尤其是那些可能被用于军事、政府情报或大规模监控目的的量子传感平台和量子网络/通信系统，美国可能禁止涉及量子计算机及其组件的生产，以及专门设计用于军事或情报用途的量子传感器的发展。如果美国企业违反了制定的规则，将面临一系列严重的法律后果和处罚。美国财政部被授权对违规行为进行调查，并可能施加民事处罚。这些处罚可能包括对提交给财政部的信息中的重大虚假陈述或重大遗漏、从事被禁止的交易，或未能及时通知需要通知的交易的行为进行罚款。根据国际紧急经济权力法（IEEPA），罚款可能高达法律所允许的最大限额。除了财务处罚之外，违规企业还可能面临其他法律后果。例如，如果违规行为构成刑事犯罪，财政部有权将案件移交给司法部长进一步处理。这可能导致刑事起诉，进一步加剧违规企业的法律风险。此外，根据行政命令，财政部长还有权宣布任何在规定生效日期之后进行的被禁止交易无效、作废或以其他方式强制撤资。这意味着违规企业可能被迫撤销交易，放弃任何已经获得的利益，并可能需要采取行动从相关交易中撤出。在新的拟议规则发布后，22日路透社发布评论文章，这是主要针对中国的科技投资限制令。一些跨国集团在中国的子公司可能会受到规则的约束，影响在其AI、量子计算、半导体等领域的投资计划。本文素材来源美国财政部官网，如有侵权请联系删除END

6月23日上午 8:41

其他

谷歌推出基于Transformer的创新技术——无限注意力

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！随着ChatGPT、Sora、Midjourney、Suno等生成式AI产品的火爆出圈，Transformer几乎成为文生图、视频、音频、文本等大模型的标配基础架构。但Transformer也有明显的缺点，就是一次性处理超长序列数据时会遭遇内存、计算的瓶颈，成本和复杂度将呈指数级增长并导致大模型的性能下降。所以，谷歌基于Transformer提出了一种创新技术Infini-Attention（无限注意力），通过将压缩记忆、局部遮蔽注意力等模块融合到传统的自注意力机制中，可轻松处理无限序列数据，同时保持有限的内存和计算资源。论文地址：https://arxiv.org/abs/2404.07143压缩记忆压缩记忆是Infini-Attention的核心模块之一，允许大模型以固定数量的参数存储和回忆信息，从而实现对长文本的有效处理。这与传统的注意力机制不同，压缩记忆不会随着输入序列长度的增加而增长，而是通过改变其参数来添加新信息，从而提升推理、计算效率并降低内存使用。在处理新的输入序列时，大模型会压缩记忆中的key和value对。该过程通过一个简单的关联绑定操作来完成，将新的key和value对与记忆中现有的信息结合起来。这种更新机制确保了即使在处理极长的序列时，大模型也能以较低的内存来完成并保持稳定。此外，为了提升大模型的检索效率，在处理每个新的输入序列时，Infini-attention会使用当前的查询从压缩记忆中检索相关的信息。这个过程主要通过一个线性注意力机制来实现，将查询与记忆中的键进行匹配并返回相应的值。这种检索机制使得大模型能够在处理长文本时，有效地利用之前序列中的信息。记忆更新记忆更新主要负责在处理新的输入序列时更新压缩记忆模块中的key和value对，既能保持大模型的性能，又能减少内存占用和节省计算资源。记忆更新是基于神经科学非常知名的概念“Hebbian学习原则”。即当一个神经元A足够接近地参与到另一个神经元B的激活时，会发生某种过程或一系列的过程，这使得A的效率作为B的一个激活源之一得到加强。换句话说，如果两个神经元同时激活，那么它们之间的连接会变得更加强大。这种机制支持了学习和记忆的过程，使得神经网络能够根据经验调整其内部连接。而在Infini-Attention中，新的输入信息通过注意力查询与现有的记忆键进行匹配，并将匹配的结果直接更新到记忆中。在每次更新过程中，记忆参数（通常是关联矩阵）会根据新的输入信息进行调整，通过计算新的key和value对与当前记忆状态的差值，然后将这个差值应用到关联矩阵上来实现。策略方面，记忆更新模块采用的是“增量式更新策略”，每次只更新与当前输入相关的部分记忆。这种策略不仅提高了更新过程的效率，还减少了因大规模参数更新带来的不稳定性。局部遮蔽注意力Transformer的自注意力机制，允许大模型在序列中的任何位置查找信息，这在处理短文本时效果很好。但当输入序列变得非常长时，会导致计算成本呈指数级增长。Infini-Attention的遮蔽机制模块主要用于限制大模型的注意力范围，使其只能关注当前处理的局部上下文，而不是无限制的全序列检索白白浪费算力。对于每个输入序列，模型会创建一个遮蔽矩阵，该矩阵与序列的维度相同。遮蔽矩阵中的元素通常是一个二值矩阵，其中1表示允许注意力聚焦的标记，而0表示需要遮蔽的标记。在计算自注意力分数时，大模型会将遮蔽矩阵与注意力分数矩阵相乘。这样，被遮蔽的标记对应的注意力分数会被设置为一个很小的值。通过遮蔽注意力分数，大模型可以计算加权和，即每个标记的上下文表示。这个加权和只包括未被遮蔽的标记，确保模型的输出集中在当前的局部上下文上，从而更好地捕捉和理解序列的连贯性。这对于生成长文本和处理复杂的语言结构非常重要。开发人员将Infini-Attention在长上下文语言建模、密钥检索任务和书籍摘要任务中进行了综合测试。结果显示，Infini-Attention模型在这些基准测试中的表现优于Transformer-XL和Memorizing

6月23日上午 8:41

其他

谷歌推出V2A，可为视频大模型自动匹配语音

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！谷歌Deepmind在官网推出了视频转音频模型V2A。用户可以用视频+文本提示的方式，通过V2A为视频模型自动匹配语音。例如，为紧张、恐怖、惊悚的片段自动匹配语音，可以进一步节省制作时间和提高效率。同时可以与谷歌的视频模型Veo相结合使用。目前，Sora、可灵、Gen-3、Dream

6月20日上午 11:05

其他

吴恩达：美国加州SB-1047法案，将扼杀开源大模型

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！今年2月7日，美国加州议会拟定了《SB-1047前沿AI大模型安全创新法案》。经过4个月6次修订、审议，该法案已经通过了一些关键条款，距离正式发布已经很近了。表面上，这是一个增强大模型安全、透明性、促进公平、吸引投资的法案。实际上，你仔细阅读其中一些关键条款，会发现这对于一些科技企业、开发者将带来非常大的负面影响。例如，根据该法案的定义，Meta的Llama-3被定义为超过1亿美元训练成本的“前沿模型”。如果有人将该模型用于非法用途，Meta也会受到严重处罚。咱们2000多年前大秦的连坐制度，咋还出口了呢~加州的地理位置非常特殊，这里既有斯坦福、加州理工、南加州大学等名校，也是谷歌、苹果、OpenAI、Meta等科技巨头总部的所在地，所以，该法案也受到了吴恩达、Yann

6月17日上午 11:07

其他

OpenAI新加入的美国前国安局长，有非法监控黑历史

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月14日，OpenAI宣布美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长（NSA）、前中央安全局局长，Paul

6月16日上午 10:03

其他

GPTZero获1000万美元，可检测ChatGPT等生成内容

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月14日，科技财经媒体techcrunch消息，生成式AI平台GPTZero获得1000万美元融资，本次由Footwork联合创始人Nikhil

6月15日上午 8:33

其他

美国退役四星上将，加入OpenAI董事会

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月14日凌晨，OpenAI在官网宣布，美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长、前中央安全局局长，Paul

6月14日上午 7:41

其他

媲美Sora，免费使用！带物理模拟的，文生视频模型

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月13日，知名3D建模平台Luma

6月13日上午 8:26

其他

Stable diffusion 3 正式开源

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月12日晚，著名开源大模型平台Stability

6月13日上午 8:26

其他

美国空军发布类ChatGPT产品—NIPRGPT

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月11日，美国空军研究实验室（AFRL）官网消息，空军部已经发布了一款生成式AI产品NIPRGPT。据悉，NIPRGPT是一款类ChatGPT产品，可生成文本、代码、摘要等内容，主要为为飞行员、文职人员和承包商提供服务。AFRL希望通过该产品能帮助空军打造一批高效率的“智能数字化战士”。ChatGPT的出现正在引发新一轮技术变革，经过一年多的实验、功能迭代、技术创新，加上微软、谷歌、苹果、Meta、亚马逊等科技巨头的积极入局，各行业也从最初的观望变成了大规模应用落地阶段。但政务机构尤其是军方部门在应用某款产品时，对数据安全的要求极其严格，不能有任何潜在威胁。事实上，美国空军应用NIPRGPT并非盲目跟风，从今年4月25日起，召开了三场“生成式AI圆桌会议”。主要由大型企业和学术界专家参与，探讨该技术在空军的应用潜力、如何高效整合现有业务流程，同时与学术界建立长期的学习、交流网络。美国空军在这三场圆桌会议上，从生成式AI的技术理念到实际应用，提出了一系列详细的需求，以下只是部分展示。如何利用生成式AI改进情报、作战规划、行政和业务流程等？如何利用生成式AI进行战术模拟和预测，帮助制定更有效的作战计划？应该使用哪些指标，来评估生成式AI的有效性？如果大规模应用生成式AI，在安全方面有哪些好的建议和方法？飞行员使用生成式AI，应该具备哪些条件以更好地来使用它们？其实，像ChatGPT这类生成式AI产品，除了拥有超强的内容生成功能之外，数据分析与预测也是它的招牌功能之一。这是因为数据预训练阶段，大模型能够自动地进行数据清洗、处理缺失值、异常值和重复数据，确保数据的完整性和一致性。再通过实体识别和关系抽取，大模型能够自动识别文本中的实体和它们之间的关系，构建知识图谱，信息的结构化表示，来增强数据的分析、预测能力。例如，在情报分析方面，大模型的自然语言处理能力使其能够处理和分析大量的非结构化文本数据。这包括从公开来源（如新闻报道、社交媒体）和秘密情报文件中提取重要信息。通过自动化的信息抽取和情报分析，大模型可以快速识别和追踪潜在威胁，识别关键实体及其关系，构建动态的情报图谱。在战场态势感知方面，大模型能够实时处理和分析来自各种传感器（如卫星图像、无人机视频、雷达信号）的数据，生成战场的动态态势图。例如，在海上作战中，大模型可以整合雷达、声呐和卫星图像数据，帮助指挥官实时监控海域态势，识别潜在威胁，如敌方潜艇或战舰的位置和动向。在作战计划和决策方面，大模型通过模拟和预测敌我双方的行动，提供战略和战术建议，预测战场上的潜在变化，帮助指挥官制定最佳的作战计划。例如，在城市作战中，大模型可以模拟不同进攻路线的战果，评估潜在的损失和胜利概率，帮助指挥官选择最优的作战进攻方案。AFRL首席信息官

6月12日上午 8:01

其他

重磅！OpenAI与苹果合作，将ChatGPT集成在iOS 18中

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月11日凌晨，OpenAI在官网宣布与苹果达成技术合作，将ChatGPT深度集成在苹果产品矩阵中，包括最新的iOS、iPadOS和macOS。苹果用户可以在手机、平板和笔记本电脑中原生使用ChatGPT进行图片生成、文本生成以及文本摘要等。Siri在ChatGPT的加持下也将变得更智能，例如，让其深度解读文档、图像等内容，都会直接给出答案。据悉，苹果本次使用的ChatGPT是由GPT-4o提供技术支持，这是OpenAI前不久刚发布的多模态大模型，支持跨文本、视频、音频进行推理，也是专为移动端打造的低消耗、高性能版本。同时，苹果在今天凌晨举办的“WWDC24”也宣布了这一消息，重磅推出了“Apple

6月11日上午 6:40

其他

谷歌推出AGREE，增强大模型生成回答准确性

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！ChatGPT、Gemini等文本理解、生成方面现出了前所未有的能力，极大地推动了生成式AI的技术创新。但这些模型在实际应用中有时会生成听起来合理，但实际上并不准确的“幻觉”内容，就是一本正经的胡说八道。为了解决这一难题，谷歌研究院在官网发布了创新框架AGREE，可增强大模型生成内容和引用的准确性。研究人员在Llama-2-13b等知名大模型进行了实验，结果显示，与现有方法相比，AGREE在提升内容回答准确性和引用性方面非常出色。论文地址：https://arxiv.org/abs/2311.09533AGREE的核心技术是通过检索文档中的相关段落来增强大模型生成回答的事实基础，并提供相应的引用。这种方法不仅可以提高回答的准确性，还可以为用户提供验证信息真实性的途径，主要由训练阶段微调和测试时自适应两大块组成。训练阶段微调训练阶段微调是AGREE提升大模型自我归因能力的关键模块，在生成每一个回答时都能够提供支持其声明的可靠来源。首先使用基础的大模型生成一系列回答，作为微调流程的起点。然后，使用了自然语言推理模型（NLI），来评估一个给定的段落是否支持一个特定的声明。在AGREE框架中，NLI模型被用来从未标记的查询中自动构建训练数据集。构建训练数据的过程包括将基础大模型生成的回答与检索到的文档进行匹配，NLI模型会为每个声明找到最相关的支持性段落，并将其作为引用附加到声明上；如果声明没有找到支持的段落，则被标记为未支持。在微调阶段，AGREE框架采用了LORA的轻量级微调技术，通过在大模型的权重矩阵上添加低秩更新，来实现高效且针对性的调整，有助于减少计算资源的消耗，同时保持模型的泛化能力。测试时自适应测试时自适应是一种动态、迭代的推理增强方法，可帮助大模型在面对新的内容查询时，能够主动地从大型语料库中检索相关信息，并对之前生成的回答进行补充和修正。这种方法与传统的静态回答生成方式不同，它强调的是在测试时不断优化和调整回答，以确保生成的内容尽可能准确和全面。测试时自适应的工作流程开始于接收到一个新的查询，经过微调的大模型会首先根据其训练阶段学到的知识生成一个初步的回答，然后进入一个自动迭代的过程，大模型会自我评估生成的回答，并识别出其中尚未归因或需要进一步支持的声明。一旦识别出需要额外信息的声明，测试时自适应就会启动检索过程。这一过程涉及到在预先构建的语料库中搜索与未归因声明相关的段落。这些段落被选出来后，大模型会尝试将它们与先前的回答结合起来，生成一个更加完善、准确的内容。同时会不断迭代循环，直至达到预定的推理效果或模型认为回答已足够完美为止。本文素材来源AGREE论文，如有侵权请联系删除END

6月11日上午 6:40

其他

OpenAI开源GPT-4 SAE，提供1600万个解释模式

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月7日凌晨，OpenAI在官网开源了GPT-4的稀疏自动编码器（Sparse

6月7日上午 7:49

其他

激发AI创新潜能，OPENAIGC开发者大赛赛题解析

人工智能（AI）的飞速发展，特别是AIGC、大模型、数字人技术的成熟，不仅改变了数据处理和信息消费的方式，也为企业和个人提供了前所未有的机遇。在这种技术进步的背景下，由联想拯救者、AIGC开放社区、英特尔共同举办的“OPENAIGC开发者大赛”自上线以来，吸引了众多AI开发者的热情参与，本文将详细介绍这次大赛的两个主要赛道，帮助参赛者更深入地理解比赛主题，激发创新思维。与此同时，联想拯救者作为本次大赛的官方指定用机，一直致力于为所有玩家和创意者提供高性能的PC产品。近期推出的全新AIPC产品系列不仅集成了「个人知识库」「文档总结」等基于AI的创新功能，让用户的工作流程更加简化效率，而且搭载了英特尔酷睿14代HX高性能处理器和先进的显卡，确保本地大模型能够流畅运行。这些高性能设备的配备无疑将为参赛者在OPENAIGC开发者大赛中提供强有力的技术支持，让他们能够充分发挥创意，挖掘AI的潜能。赛道一：创未来·AI应用赛AI应用赛鼓励参赛者围绕人工智能技术（如AIGC、大模型、数字人），开发出创新的个人或企业级应用。这些应用可以是SaaS产品、APP应用、PC应用、浏览器插件，或者是为企业内部设计的方案和产品。同时，也欢迎基于纯创意的作品参赛。AI应用赛细分赛道作品方向1、视频/视效类：利用大语言模型自动总结文本段落中的情节内容，并转化为镜头语言或分镜描述，生成时长从4秒到60秒不等的镜头片段，这些片段可以通过人工或自动方式进行拼接和剪辑，以形成一部完整的叙事视频。此技术也可应用于特定场景，如动漫制作、快速生成企业或高校的宣传片、小说推文和视频预告片等。2、图片应用类：利用文字描述或原始图片，可以生成新的图片，适用于配图或图片编辑。例如：（1）文章插图和儿童绘本：基于文章内容，使用大模型自动提供描述性关键词（prompt），产生相应插图。可以扩展到根据整部小说文本自动生成完整的绘本。（2）游戏与动漫图像：游戏和动漫专业人员可以定制关键词，以快速生成游戏中的过场图、角色原画或动漫场景图像，提升制作效率。（3）电商营销图片：上传商品图片后，根据场景或模特提供或自定义关键词，商品可以自动呈现在生成的模特身上，比如服装、首饰等，或者生成商品的使用场景，减少实际拍摄成本，并可将模特图片替换为客户自己的照片，以增强客户体验。3、文本生成/处理类：针对文字类的生成、总结、提炼的大模型基础能力。例如：（1）教育行业：利用大模型帮助撰写和整理论文（包括开题报告、大纲、内容等），并总结论文要点。在数学、物理和化学等科目中，模型可以辅助进行题目要点解析和答案解析，实现引导式教学，并根据不同学习者提供定制化的教学策略。（2）营销行业：根据要求，自动生成各种营销文本，如企业宣传文稿、商品说明书、汽车手册和新闻稿等。（3）医疗行业：为用户提供基础的医疗知识问答服务，包括药品使用说明、服药注意事项以及根据症状提供初步的疾病判断或药物使用建议。（4）创作领域：根据特定要求生成不同类型和题材的文学作品，如小说、散文、诗词，以及电影脚本和对白等。（5）办公领域：可输入长篇文字内容，大模型自动进行归纳总结，运用在会议记录、录音转写以及自动总结待办事项等。4、数字人应用类：拥有一个具体形象的个人数字助理，例如小米的“小爱同学”，以及苹果的“Siri”，微软的小冰等。它们通常结合一个虚拟形象和查询对话能力，以及执行操作的功能，主要用于个人助理场景。（1）数字人播报：利用准备好的稿件，通过数字人形象进行新闻播报，优点在于成本较低且无人为错误。（2）数字人视频制作：通过对真人形象进行克隆和建模，可以生成口述内容的视频，避免了真人亲自出镜的需求，这适用于内容创作者、企业宣传等场景，并且由于不需要现场拍摄，生产效率较高。（3）电商直播带货：利用预设的脚本，数字人可以实现全天候直播，进行商品介绍和销售。高级系统还能自动回应某些评论或问题，极大地减少了成本，且不需要休息，提高了直播效率。（4）个人数字助理：类似电影中设想的未来数字人虚拟管家，用户可以直接与其对话，完成查询、计算和操作各类工具等任务。5、3D应用类：用户上传图片，可自动根据图片生成对应的3D模型，一般可用作需要3D建模的场景，比如游戏中的人物与场景设计、建筑设计、室内装潢以及工业产品设计等领域

6月6日上午 7:47

其他

OpenAI首次公开前沿大模型安全：基础架构、保护措施等

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月6日凌晨，OpenAI在官网公开了前沿大模型的安全策略，包括基础架构、保护措施、敏感数据存储、开发人员访问管理等。这也是OpenAI首次系统性的公布大模型开发安全方面的高级细节，让外界深度了解其模型的开发流程，同时可为开发者在研究最新的前沿大模型提供技术借鉴。下面「AIGC开放社区」就为大家解读一下主要内容。基础研究架构OpenAI的研究技术架构建立在微软的Azure云服务之上，并通过Kubernetes（谷歌开源的容器平台）进行辅助。OpenAI的身份基础基于

6月6日上午 7:47

其他

谷歌创新框架：从非结构化数据，实现多模态学习

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！看、听、说的多模态已成为主流大模型的重要功能之一。但在数据爆炸时代，大模型学习文本类的结构化数据相对还好一些，但要去学习视频、音频、图片等非结构化数据非常困难。目前，从结构化和非结构化数据实现多模态学习，会随着模态数量、输入大小和数据异构性的增加，深度神经网络会变过拟合和泛化效果不佳。尤其是当在规模有限的数据集上训练时，这一状况就越发明显，例如，经常表现出非平稳行为的时间序列数据。因此，谷歌提出了创新框架LANISTR来解决这些难题。论文地址：https://arxiv.org/pdf/2305.16556LANISTR是一个基于注意力机制的框架，其核心思想是在单模态和多模态层面上应用基于掩码的训练。还特别引入了一种新的基于相似度的多模态掩码损失，使其能够从存在缺失模态的大型多模态数据中学习跨模态之间的关系。多模态融合编码器现实数据经常以复合形式存在，单一模态的数据往往不足以捕捉事件的全貌。例如，在医疗诊断中，临床报告和MRI扫描图像才能展现患者状况的全面视图；而在电子商务中，商品描述与销售历史（时间序列）相结合才能更好地预测市场需求。因此，一个好用的多模态大模型，必须具备将这些分散信息源综合的能力。为了实现这一目标，LANISTR采用了基于Transformer架构的交叉注意力机制。多模态融合编码器可将来自各模态的嵌入向量首先被串联起来，然后通过一系列的Transformer层进行处理。在这些层中，交叉注意力机制发挥了重要作用，允许模型在不同的模态表示之间自由“询问”和“回答”，使每个模态的特征都能关注其他模态的特征，并根据它们的相关性和重要性进行加权整合。这一流程与人脑思考有些类似，可根据上下文和情境在不同感官信号间切换注意力，从而实现信息的高效整合。4种编码器介绍LANISTR中的多模态融合编码器一共由文本、图像、表格和时间序列4种编码器组成，每种模态都有其独特的表达方式和信息结构。这种机制不仅增强了对单个模态特征的理解，还促进了模态间的交互学习，从而对整个场景有了更加全面的认识。文本编码器：基于Transformer架构主要处理文本数据。通过掩码语言方法进行预训练，随机掩盖文本中的部分词汇，让模型学习预测这些被掩盖词的能力。这种机制促使模型理解词语间的依赖关系和语境含义，从而提取出丰富的语言特征。图像编码器：采用Vision

6月3日上午 6:51

其他

麦肯锡：ChatGPT等生成式AI应用激增，大中华区增长最快

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！全球顶级咨询公司麦肯锡（McKinsey

6月3日上午 6:51

其他

人人都能制作动漫视频，神鬼寓言推出Showrunner

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！6月1日，著名游戏开发工作室神鬼寓言推出了文生视频产品Showrunner，用户只需输入文本提示就能快速制作2—16分钟的各种动漫视频。如果你想对生成的视频做进一步优化，Showrunner还支持自定义剧本、运镜、配音等专业功能，同时这也是一个分享平台，用户制作的视频都可以在这个平台上进行分享。目前，神鬼寓言已经放出了《Hutzpa!》、《Ikiru

6月2日上午 8:48

其他

中国发布《生成式AI安全基本要求》，涵盖训练数据、生成内容等

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！全国网络安全标准化技术委员会在官网发布了，国家标准《网络安全技术

6月2日上午 8:48

其他

ChatGPT Edu版本来啦：支持GPT-4o、自定义GPT、数据分析等

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月31日，OpenAI在官网宣布，推出ChatGPT

5月31日上午 8:23

其他

OpenAI与普华永道合作，为10万员工提供ChatGPT

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月30日，全球四大会计事务所之一的普华永道（PwC）在官网宣布，与OpenAI达成技术、市场双向合作，成为其最大客户和首家产品经销商。根据协议，普华永道将向其美国75,000名和英国的26,000名员工提供ChatGPT

5月30日上午 8:20

其他

官宣！马斯克的xAI获60亿美元融资，估值240亿美元

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月27日晚，马斯克旗下的大模型平台xAI在官网宣布获得60亿美元B轮融资，估值240亿美元。本次主要投资者包括Valor

5月28日上午 8:15

其他

Meta等最新研究：多token预测，提升大模型推理效率

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！GPT-4、Gemini系列、Llama-3等开闭源大模型，通常使用的是下一个token预测（Next-token

5月27日上午 8:36

其他

德勤：中国、印度等对ChatGPT等生成式AI应用，处领先地位

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！全球四大会计事务所之一的德勤（Deloitte）在官网发布了一份，名为《Generative

5月27日上午 8:36

其他

ChatGPT等生成式AI，在旅游行业非常受欢迎

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月25日，知名国际管理咨询公司Oliver

5月26日上午 7:53

其他

马斯克的xAI将开发一台，包含10万个GPU超级计算机

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月26日，The

5月26日上午 7:53

其他

每周节省7800万工时！ChatGPT等成美国降本增效利器

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月23日，全球最大教育、商业出版社之一的Pearson

5月24日上午 7:58

其他

视频版PS！0样本视频编辑模型，普通人秒变钢铁侠

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！巴黎矿业大学、以色列理工学院的研究人员联合推出了一款创新视频模型——Slicedit。Slicedit主要通过结合文生图像的扩散模型以及对视频时空切片的预处理，在不影响背景的情况下对视频主体进行修改。例如，将一名冲浪的男人变成钢铁侠，将一名转球的男孩变成NBA巨星库里，将猫的样子变成豹等。虽然更改的视频质量并不是很理想，会出现模糊、扭曲的情况。但这种方式对于不会使用AE专业视频编辑软件的业余人员来说帮助巨大，可以快速完成视频内容修改，相当于视频版的PS。用来做鬼畜、抖音、快手类的搞笑视频非常方便。论文地址：https://arxiv.org/abs/2405.12211把一名冲浪男人轻松变成钢铁侠，背景没有发生任何改变。文生图领域涌现出了DALL·E

5月23日上午 8:16

其他

微软“Build 2024”大盘点：Copilot、大模型，生成式AI时代来啦！

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月22日凌晨，微软在西雅图召开“Build

5月22日上午 9:42

其他

微软发布Copilot+ PC：集成GPT-4o，史上最强、最快Windows！

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月21日凌晨，微软发布了Copilot+

5月21日上午 9:33

其他

多元融合，行业大咖齐聚，OPENAIGC开发者大赛超强评审阵容来袭！

随着“AI生成未来·第二届拯救者杯OPENAIGC开发者大赛”的火热筹备，各界对于本次比赛评审团的构成与背景愈发关注。今天，我们将揭秘这支由30多位行业大咖和学术权威共同组成的强大评审团，他们不仅在各自的领域拥有丰富的经验和深厚的知识储备，同时也体现了AIGC技术的发展方向和行业未来趋势，他们将为大赛贡献宝贵的见解与经验，确保比赛的公正性与专业性，为所有参赛者提供学习和成长的机会。权威技术专家的领航来自联想、英特尔、微软、亚马逊云、华为云的技术专家，他们在人工智能、机器学习、大数据、云计算等领域拥有深厚的技术积累和实践经验。他们的参与，不仅能够从技术的角度严格把控比赛的质量，还能为参赛者提供行业前沿的技术指导和建议，助力参赛项目的技术提升和创新。联想作为大赛联合主办单位，将秉承「AI

5月20日上午 6:54

其他

谷歌发布文生图模型Imagen 3，写实效果超强！

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！谷歌在“I/O2024”大会上发布了，全新文生图片模型Imagen3。据悉，Imagen3在理解文本提示方面比前两代更好，可捕捉长文本提示中的很多细微细节，对图片的嵌入文字生成也更加准确、稳定。Imagen3可生成漫画、写实、赛博朋克、水墨、油画、素描等几十种风格，尤其是生成的写实风格图片质量很好，和真人拍摄的相片几乎差不多。目前，Imagen3支持申请试用，有兴趣的小伙伴可以去体验下。可申请体验：https://docs.google.com/forms/d/e/1FAIpQLSeC6n1KQlaqRNUGNuNRt5Q7YeoyXsq828niw2ZvIoAtW1FtYQ/viewform?resourcekey=0-qDKZCeB4G9nS9dttXGdnHQ&pli=1在谷歌展示的Imagen3案例中，其生成写实图片的能力非常强可比肩Midjourney

5月19日上午 7:43

其他

4场线上技术指导+4场线下城市沙龙，OPENAIGC开发者大赛能量充电走起！

“AI生成未来·第二届拯救者杯OPENAIGC开发者大赛”自上线以来，迅速成为技术界的焦点，吸引了众多开发爱好者的关注和参与。大赛旨在探索和展现AI技术的最新进展和应用潜力，鼓励大家积极在人工智能领域进行创新和实践。作为本次大赛官方指定用机的联想拯救者一直以来都致力给所有玩家和创意者提供高性能PC产品。联想以「AI

5月17日上午 8:16

其他

与微软专家面对面，这场精彩的AIGC技术分享峰会别错过！

AIGC是近年来人工智能技术迅速发展的一个重要领域。从早期的简单字符生成到现在可以撰写复杂文章、生成高清图片甚至编写代码，AIGC技术的发展突飞猛进，不仅在文学创作、艺术设计、游戏开发和软件编程等领域展现出惊人的潜能，也对各行业提供了前所未有的挑战和机遇。为了向技术开发者、业务人员、高校学生、以及个体创业人员等AI技术关注者们提供更深入的行业洞察、技术交流平台和创新思维的启发，AIGC开放社区特别组织了一系列城市巡回沙龙活动。在5月19日12:30-17:00的苏州站中，我们有幸邀请到多位专家进行深入的主题分享，与参与者们共同交流、探讨，一起学习AIGC的相关知识，分享落地解决方案。欢迎大家参与，在AIGC的世界中共同探索、成长，发掘无限可能！详细议程安排，请参阅下方海报。点击【阅读原文】，报名线下参与！

5月16日上午 8:40

其他

谷歌发布Veo：文生超1分钟、1080P视频，媲美Sora

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！5月15日，谷歌召开“

5月16日上午 8:40

陈佩斯，这次真悬了！

不能返税、不能补贴，招商局长们怎么办？

大，无需多言，事实胜于雄辩

2024年最佳公众号排行，不用瞎忙，关注它们你就成功了一半

英美所谓联合声明无端指责中国，干涉中国内政，中方强烈不满、坚决反对！

AIGC开放社区