2025-07-04日刊

AI洞察日报 2025/7/4

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI内容摘要

AI产品加速效率革新,如Excel助手、AI设计代理和智能机器人。
多模态生成模型持续涌现,从动漫视频到移动端音频。
行业关注AI对流量、医疗及人才结构影响,并强调开放与核心技术。

AI产品与功能更新

  1. Shortcut这款AI Excel助手简直是Excel用户的福音!✨它利用自然语言处理技术,让你无需公式或VBA代码就能自动化完成复杂的Excel任务,大大降低了技术门槛。更厉害的是,它在Excel世界锦标赛中展现出比人类选手快10倍的速度和超高准确率!💯 Shortcut功能强大,涵盖数据处理、计算、格式化、透视表与图表生成等,有望彻底改变财务建模数据分析的工作流,绝对是未来Excel的标配工具。🚀 赶紧看看吧:'项目地址'
    Excel助手界面

  2. Lovart AI的中文版——星流Agent终于和大家见面啦!🎉 这款Liblib开发的AI设计代理,特别针对中文字体支持批量海报生成进行了优化,设计师和创作者们只需简单描述,就能高效生成专业级视觉设计。🎨 而且,星流Agent还搭载了强大的多模态视频生成功能,价格亲民,用量更大,绝对是国内设计师和内容创作者手中的高效AI创作工具,有望成为品牌营销和个人创作的标杆工具哦!🤩

    星流Agent界面

  3. Anthropic的Claude Code最近迎来了超赞的更新!🎉 新增的Hooks功能,让开发者可以在AI编程的代理循环中自定义shell命令,这意味着对代码格式化、测试运行等关键任务有了确定性控制!这不仅大大提升了开发工作流的自动化和稳定性,更标志着AI编程工具正从简单的辅助升级为深度集成,帮助开发者构建更复杂的自动化流程。🤖

    Claude Code界面

  4. B站太给力了!🥳 最近开源发布了他们家的动漫视频生成模型AniSora V3,简直是动漫爱好者的福音!✨ 这次更新不仅大幅提升了生成质量动作流畅度风格多样性,还新增了对华为昇腾910B NPU的原生支持,为动漫创作者们提供了超强工具。💪 AniSora V3有望降低动漫创作门槛,让独立创作者和小型团队也能低成本制作出高质量动画,完美填补了通用视频模型在动漫领域的空白!💖 快来看看:'项目地址'
    AniSora V3生成动漫

  5. Stability AI和芯片巨头Arm联手放大招啦!🥳 他们开源了一款专为移动设备优化文本到音频生成模型Stable Audio Open Small。这个模型只有341M参数,竟然能在Arm CPU上本地快速生成高质量立体声音频,完全不需要云端处理!☁️ 这一步标志着AI音频生成技术边缘计算移动设备迈出了一大步,简直是普天同庆!🎉 未来专业级音效设计有望普及,让更多普通用户也能玩转音频创作啦!🎶 戳这里看详情:'项目地址'

    Stable Audio Open Small界面

  6. 亚马逊最近推出了重磅AI大模型——Deep Fleet!🤖 这款模型的目标是提升其全球百万工业移动机器人车队的智能化效率,预计能让机器人出行效率提升10%!💡 Deep Fleet通过优化导航路径、减少拥堵,不仅能加速包裹配送、降低运营成本,还间接推动了超过70万名员工的技能提升,一举多得,太棒了!👏

    Deep Fleet模型示意

  7. 智源放大招了!🎉 他们发布的OmniGen2是一款强大的统一图像生成模型,支持文本生图像图像编辑以及多模态上下文参考生成等超多功能,而且还全面开源啦!🥳 这项目简直火爆,一周内GitHub星标突破2000!✨ OmniGen2凭借其强大的基座模型能力和创新架构,让用户只需简单的自然语言指令,就能轻松编辑或创建高质量图像。🎨 赶紧去看看:'项目地址''论文地址'
    OmniGen2功能示例

AI前沿研究

  1. 字节跳动PICO-MR团队又放大招了!🎉 他们最近开源发布了EX-4D,这是一款划时代的4D视频生成框架。它能从单一视角视频直接生成高质量、多视角4D视频序列,完美解决了传统技术在处理遮挡和极端视角时的老大难问题。👏 这项技术在各项指标上都遥遥领先,为沉浸式3D内容创作和构建"世界模型”提供了关键支持,有望加速AI视频生成技术在创意产业中的普及和应用,未来太值得期待了!🤩 传送门:'项目地址'

    EX-4D生成界面
    EX-4D技术效果

  2. 哇哦!一项名为局部感知并行解码 (LPD) 的新方法横空出世,旨在显著加速自回归图像生成!🚀 它通过优化生成顺序和并行化策略,在不牺牲图像质量的前提下,大大减少了生成步骤,还显著降低了延迟。💡 这项技术性能超越了现有并行自回归模型,简直是图像生成领域的"加速器”!✨ 更多细节在这里:'论文地址'

AI行业展望与社会影响

  1. Similarweb的报告敲响了警钟!🔔 尽管ChatGPT为新闻出版商带来了25倍的流量推荐增长,但这远远弥补不了用户直接通过AIAI驱动的搜索结果获取新闻,导致点击量大幅下滑的损失(无点击比例竟然高达近69%!😱)。面对这种"AI吞噬流量”的挑战,新闻出版商们正在积极寻找出路,探索像谷歌Offerwall服务、付费墙等多元化盈利模式,只为能在这场流量危机中生存下来。💪

    新闻阅读界面

  2. 毕马威中国《首届健康科技50》报告惊人揭示:中国在医疗大模型领域已傲视全球!🌍 已发布的模型数量占比超过70%(其中大语言模型更是C位出道!),而且智能医疗器械市场也展现出强劲的增长势头。📈 这些数据充分表明,中国在健康科技,特别是医疗人工智能和智能医疗器械方面,不仅创新能力爆表,市场潜力更是巨大!未来可期呀!🌟

    医疗科技图表

  3. 荣耀CEO李健在发布会后的媒体对话中掷地有声地强调,在AI时代,"开放”是荣耀的核心理念!🤝 他们不仅宣布将支持MCP和A2A协议,还将与阿里巴巴比亚迪美的等一众巨头展开深度合作。荣耀致力于实现生态、思想和理念的"三点开放”,就是希望通过和各方携手,共同推动AI真正落地,更好地服务用户,这格局,点赞!👍

  4. 😮 加密交易平台Robinhood在欧洲搞了个"OpenAI代币”,结果引起轩然大波!OpenAI赶紧在社交媒体X上澄清:这些代币可不代表我们的股权哦,而且我们和Robinhood压根儿没合作!🙅‍♀️ OpenAI提醒投资者要擦亮眼睛,保持谨慎。🧐 而Robinhood呢,这一招是为了增加散户投资者对私人市场的间接接触,结果他们的股价还一度飙升到历史新高,真是让人哭笑不得。😅

    OpenAI标志

  5. 蔻町智能创始人兼CEO宿文语出惊人!🤔 他直言当前流行的Copilot模式是创业陷阱,认为真正的AI编程应该深耕自研基座模型,去解决更复杂的端到端问题。宿总还预测,由个性化应用需求驱动的增量市场即将爆发!💰 他们的AutoCoder产品,目标是实现L3阶段端到端软件生成,让用户"不写代码”也能快速交付产品,这简直是彻底释放软件创造力的神操作啊!🤩 更多内幕:'更多详情'

  6. 惊变!😱 美国国家科学基金会NSF)的研究生奖学金项目近期进行了大刀阔斧的调整:生命科学的获奖者锐减,而计算机科学人工智能量子信息科学领域的占比却显著飙升!📈 这一变化让科学家们忧心忡忡,担心这可能偏离NSF培养广泛STEM人才的初衷,对未来的科学发展和多样性产生负面影响。🤔 究竟是福是祸?拭目以待:'更多详情'
    NSF基金会标志

开源TOP项目

  1. 字节跳动最近大手笔开源VINCIE-3B模型!🚀 这个3亿参数的上下文连续图像编辑模型,厉害之处在于它创新性地通过视频数据学习,无需繁琐的预处理就能实现业界顶级的编辑能力。这无疑将推动创意设计和内容生成进入一个全新的时代!🎉 更多信息请看这里:'项目地址'。该模型基于MM-DiT架构开发,并采用Apache2.0许可证发布,大大降低了AI内容创作的门槛,普惠全球开发者!✨

    VINCIE-3B模型图

  2. Ladybird项目,一个拥有44376颗星的宝藏!🌟 它是一款真正独立的网页浏览器,致力于为用户提供独立、流畅的网页浏览体验。想摆脱束缚,感受纯粹的浏览乐趣吗?快来探索吧:'项目地址' 🥳

  3. Genesis,一个星标数高达25502开源项目,简直是机器人和AI爱好者的天堂!🤖 它旨在为通用机器人具身AI学习构建一个"生成世界”,推动AI在真实世界的应用和发展。想看看AI如何在现实中大展身手吗?👀 传送门:'项目地址'

  4. Free-Certifications项目,拥有34988颗星,简直是"免费学习”的百科全书!📚 它汇集了海量的免费认证课程精选列表,旨在帮助小伙伴们轻松获取免费的学习和认证资源,分分钟提升专业技能!💪 还在等什么?快来充实自己吧:'项目地址' 😉

社媒分享

  1. Gorden Sun分享的X-UniMotion项目简直是"手部动作模拟大师”!🖐️ 这是一个能够实现精细手部动作视频模型,最牛的是它能完美复刻参考人物复杂又精确的手部动作,几乎看不出任何瑕疵!😲 太神奇了!想一睹为快吗?戳:'更多详情'

  2. Yangyi深入探讨了reCAPTCHA在辨别人类和机器人、维护网络秩序中的重要作用。🤖 他还提出一个大胆的设想:随着AI Agent的崛起,未来大型平台为了增加"作恶”的成本,可能会用付费注册来取代烦人的验证码!💰 这会不会成为未来趋势呢?🤔 更多思考:'更多详情'

  3. 吕立青_JimmyLv敏锐地察觉到,开发者们使用OpenAI API的情况似乎在减少。🤔 而Nat Emodi则补充说,OpenRouterAI的实时Token使用排名是个"晴雨表”,能帮助我们了解AI模型的市场采纳度和竞争格局,这似乎预示着市场采用趋势正在悄然变化呀!📈 看看发生了什么:'更多详情'
    OpenAI API使用图
    OpenRouterAI数据

  4. 吕立青_JimmyLv幽默感十足地指出,在AI时代,真正的需求线索,竟然就藏在用户对chatbot的每一次"怒吼”里!😠 不过,他同时也乐观地预计,这些需求很快就会被chatbot通过"自举”能力给妥妥地解决掉。🤣 真是个乐观派!更多爆笑观点:'更多详情'

  5. Freepik平台这波操作简直是创作者狂喜!🥳 他们宣布,Premium+Pro订阅用户现在可以无限生成图像啦!无限!🤯 这个功能超强大,支持Mystic、Google Imagen等多种AI模型,为创作者们带来了史无前例的便利。📸 再也不用担心生成次数限制了,想怎么玩就怎么玩!✨ 快去探索:'更多详情'

  6. 歸藏分享了一款神仙工具——ShortcutExcel Agent!🤩 它简直是Excel界的小能手,能自动化完成大多数Excel知识型任务,速度快到飞起,远超人类!🚀 特别是对于财务等经常和表格打交道的小伙伴来说,意义重大。这款工具在Excel世界锦标赛中表现惊艳,而且提供了接近Excel的全部功能,简直是Excel效率神器!✨ 快去看看:'更多详情'

  7. JimmyLv的洞察力太赞了!👀 他指出,最近Claude CodeGemini CLI的流行,正好印证了他之前关于CLI(命令行界面)比GUI(图形用户界面)更胜一筹的观点。他说,在AI出现之前,GUI简直是人机交互的"弯路”!🤣 JimmyLv强调,CLI拥有更全面、更强大的操作能力。🤔 更多深度思考:'更多详情'
    CLI与GUI对比

  8. 秀达的观察很到位!🤔 AI爆火两年半了,但大家对AI判断却南辕北辙:有人觉得它是互联网的一个小分支,有人则认为它是未来的一切!🌍 这种观念上的巨大差异,直接影响着个人的选择、团队的人才构成和公司的组织架构。最终谁对谁错,成功与否,就让时间来揭晓答案吧!⌛️ 更多思考:'更多详情'

  9. 宝玉发出紧急警示!🚨 他揭露,目前有不法分子利用假简历,同时在多家AI创业公司、特别是YC公司兼职,其中竟点名印度Soham Parekh!😱 宝玉曾开除并苦口婆心地劝诫过Soham Parekh,但他的欺诈行为依然没有停止。宝玉呼吁业界提高警惕,千万不要上当受骗!⚠️ 更多详情:'更多详情'


收听语音版AI日报

🎙️ 小宇宙 📹 抖音
来生小酒馆 来生情报站
小酒馆 情报站