█脑科学动态
让人类更智慧的新基因,也让人类更易患癌
社交互动通过皮质-杏仁核神经回路抑制进展
从完全截肢到功能恢复:苹果蜗牛相机型眼睛的再生机制
儿童如何学会察言观色,从“看脸”到“懂心”的认知飞跃
全息经颅超声神经调控:精准、无创激活活体动物大脑回路
奖励通过不同脑回路调控注意与决策
大规模基因研究揭示老年人虚弱的生物学基础
早点吃饭或可抵消肥胖的遗传风险
█AI行业动态
全球首款神经免疫调节设备获批!类风湿性迎来革命性疗法
苹果脑机接口技术突破:患者用意念操控iPad
Grok 4国际象棋首战称王
Claude Opus 4.1强势登场:编程性能刷新纪录
OpenAI重磅开源GPT OSS模型家族:117B参数单卡可跑
MLE-STAR:自动化机器学习任务的革命性代理
█AI驱动科学
Cell:AI从头设计微型蛋白,将先导编辑效率提升近19倍
Nature:人工智能代理时代来临,我们亟需新的伦理规范
AI文献综述的陷阱:ChatGPT会推荐已撤稿的错误论文
AI模拟人类辅助社科研究:潜力巨大但挑战犹存
利用拓扑学“形状”分析,新框架可检测多模态AI中的对抗性攻击
Concept2Brain:一个预测大脑对文本和图片反应的AI模型
脑科学动态
让人类更智慧的新基因,也让人类更易患癌
演化如何塑造了人类的独特性与脆弱性?中国科学院遗传与发育生物学研究所的李川昀团队与北京大学的程强团队合作,揭示了驱动人类大脑发育和认知能力提升的“从头起源基因”,竟也是一把双刃剑,同时扮演着癌症“助推器”的角色。基于此发现,他们将这些基因作为靶点,开发出新型mRNA癌症疫苗。
研究团队首先通过大规模生物信息学分析,锁定了37个在人类演化后期才出现的从头起源基因(de novo gene,即从非编码序列演化而来的新基因)。这些基因被证实与人类大脑的增大和认知能力的增强有关,但研究人员意外发现,它们在多种肿瘤组织中被异常激活和广泛表达,其部分原因可能与染色体外环状DNA(ecDNA,一种能帮助癌细胞快速演化的遗传物质)的扩增有关。
为了验证其致癌作用,研究团队利用CRISPR基因编辑技术系统性地抑制这些基因,发现超过半数(57.1%)的基因缺失能够有效抑制肿瘤细胞的增殖。这一发现揭示了演化赋予人类智慧的代价,但也为癌症治疗提供了全新思路。作为概念验证,团队针对两个仅在胚胎发育和肿瘤中表达的基因ELFN1-AS1和TYMSOS,开发了mRNA疫苗。在人源化小鼠模型中,该疫苗成功将这些肿瘤特有的蛋白作为新抗原呈递给免疫系统,激活了能够精准狙击癌细胞的T细胞,并显著抑制了肿瘤生长。研究发表在 Cell Genomics 上。
#疾病与健康 #个性化医疗 #从头起源基因 #癌症免疫治疗 #mRNA疫苗
阅读更多:
Xiao, Chunfu, et al. “Oncogenic Roles of Young Human de Novo Genes and Their Potential as Neoantigens in Cancer Immunotherapy.” Cell Genomics, vol. 0, no. 0, Jul. 2025. www.cell.com, https://doi.org/10.1016/j.xgen.2025.100928
社交互动通过皮质-杏仁核神经回路抑制乳腺癌进展
积极的社会交往为何能改善癌症患者的预后?针对这一“身心联系”问题,陆军军医大学的吴广延、熊鹰、戴礼猛等人进行研究,首次揭示了其背后的神经机制。他们发现,社交互动通过激活一条从大脑皮层到杏仁核的关键神经回路,能够有效抑制小鼠乳腺癌的生长。
研究团队利用乳腺癌小鼠模型发现,生活在群体环境(有社交互动)中的小鼠比被隔离的同伴肿瘤生长得更慢。为了探明其神经机制,他们聚焦于一条特定的神经通路——从前扣带回皮质(ACCGlu)到基底外侧杏仁核(BLA)的谷氨酸能通路。实验证实,社交互动会激活这条 ACCGlu→BLAGlu 回路,进而抑制肿瘤内部的交感神经活性,并减少的释放。这种神经调控改变了肿瘤的微环境,有效地增强了机体的抗肿瘤免疫反应。研究人员还利用化学遗传学进行了因果验证:当人工抑制该神经通路时,社交互动的抗癌效果便会消失;反之,即便小鼠处于隔离状态,只要人工激活这条通路,也能达到抑制肿瘤生长的效果。研究发表在 Neuron 上。
#疾病与健康 #神经机制与脑功能解析 #癌症 #神经免疫学
阅读更多:
Wen, Hui-Zhong, et al. “Social Interaction in Mice Suppresses Breast Cancer Progression via a Corticoamygdala Neural Circuit.” Neuron, vol. 0, no. 0, Aug. 2025. www.cell.com, https://doi.org/10.1016/j.neuron.2025.07.002
从完全截肢到功能恢复:苹果蜗牛相机型眼睛的再生机制
人类复杂的眼睛一旦受损便无法复原,科学家该如何寻找修复之法?斯托尔斯医学研究所的 Alejandro Sánchez Alvarado 和现就职于加州大学戴维斯分校的 Alice Accorsi 团队,将目光投向了苹果蜗牛。他们成功将这种能完全再生其类人眼球的蜗牛,建立成一个全新的、可进行基因编辑的研究系统。
▷苹果蜗牛眼球再生过程从截肢到完全修复,历时28天,分为四个阶段:伤口愈合、特殊细胞团形成、晶状体和视网膜出现,以及所有眼部结构成熟。Credit: Stowers Institute for Medical Research
研究首先确认,苹果蜗牛拥有与人类相似的复杂照相机式眼睛(camera-type eye)。在被完全切除后,蜗牛的眼睛能在28天内经历四个阶段完全再生。这项研究最大的突破在于,团队首次为苹果蜗牛引入并优化了CRISPR-Cas9基因编辑技术。为了验证该系统的有效性,他们靶向了pax6基因——一个在从果蝇到人类的物种中都公认的“眼睛发育主控基因”。结果证实,被敲除了pax6基因的蜗牛胚胎完全无法长出眼睛,这不仅证明了pax6功能的高度保守性,也确立了苹果蜗牛作为研究眼部发育和再生的强大遗传学模型。通过分析再生过程中的基因活动,研究人员还筛选出了一系列候选基因,为未来找到启动人类眼部修复的开关提供了关键线索。研究发表在 Nature Communications 上。
#疾病与健康 #神经机制与脑功能解析 #再生医学 #模式生物
阅读更多:
Accorsi, Alice, et al. “A Genetically Tractable Non-Vertebrate System to Study Complete Camera-Type Eye Regeneration.” Nature Communications, vol. 16, no. 1, Aug. 2025, p. 6698. www.nature.com, https://doi.org/10.1038/s41467-025-61681-6
儿童如何学会察言观色,从“看脸”到“懂心”的认知飞跃
儿童是如何学会“察言观色”,从看懂表情到理解情感的?北京大学心理与认知科学学院的 Xie Wanze、威斯康星大学的 Seth Pollak 及研究第一作者 Shuran Huang 合作进行了一项研究。他们发现,儿童情绪理解力的发展存在一个关键的认知转变:随着成长,孩子会从依赖直观的感知线索(看脸),转向更多地依靠后天习得的复杂概念知识(懂心)。
▷FPVS 范式示意图。Credit: Nature Communications (2025).
研究团队对5至10岁的儿童进行了三项关联实验。首先,他们使用脑电图频率标记(EEG frequency tagging)技术发现,即使是5岁的幼儿,其大脑也能在神经层面自动区分快乐、愤怒等不同面部表情,表明基础的感知能力早已存在且稳定。然而,行为实验(包括分类和匹配任务)揭示了另一番景象:年幼儿童倾向于将情绪简单地分为好与坏,而年长儿童则能精细地区分愤怒和恐惧这类相似的负面情绪。通过词语相似性任务,研究还证实年长儿童拥有更丰富的概念知识。为了整合这些发现,团队采用了表征相似性分析,这是一种比较不同模态数据(如神经信号和行为数据)间关联的方法。分析结果清晰地指向一个核心结论:在儿童情绪理解的发展过程中,存在一个从感知主导到概念主导的认知转变。这意味着,儿童的成长过程,就是其大脑从单纯“看到”表情,升级为结合经验和知识去“理解”情感的过程。研究发表在 Nature Communications 上。
#认知科学 #神经机制与脑功能解析 #情绪发展 #认知发展
阅读更多:
Huang, Shuran, et al. “Conceptual Knowledge Increasingly Supports Emotion Understanding as Perceptual Contribution Declines with Age.” Nature Communications, vol. 16, no. 1, Jul. 2025, p. 6838. www.nature.com, https://doi.org/10.1038/s41467-025-62210-1
全息经颅超声神经调控:精准、无创激活活体动物大脑回路
如何在大脑中进行精准无创的靶向操作以治疗神经疾病?来自纽约大学朗格尼健康中心、苏黎世大学和瑞士苏黎世联邦理工学院(ETH 的科学家(包括Shy Shoham和Daniel Razansky)取得突破,他们开发出一种结合聚焦声波和全息图的新技术,首次在活体动物中实现了对特定大脑回路的精准激活,并证明其效率远超传统方法。
▷将超声扰动无创、精准且高度可控地传递至小鼠大脑。Credit: Nature Biomedical Engineering (2025).
该研究的核心是一种创新的经颅超声刺激(transcranial ultrasound stimulation, TUS)技术。研究团队使用一个包含512个超声发射器的头盔状阵列,通过计算生成声学全息图(acoustic holograms),将超声波能量以前所未有的精度聚焦成特定的几何图案(如三角形或五边形)投射到小鼠大脑皮层。为了实时观察效果,他们结合了宽场荧光成像技术,可以直接看到被激活的神经元“亮起来”。研究最关键的发现是,与用单个光束刺激单个脑区相比,用全息图模式同时激活一个分布式的神经元网络效率极高。这种方法利用了大脑回路内部的连接,使神经元对超声波的敏感度提高了10倍,从而将激活神经元所需的能量阈值降低了一个数量级。这意味着未来有望使用更低、更安全的能量进行神经调控,为治疗帕金森病、精神健康障碍等疾病开辟了新途径。研究发表在 Nature Biomedical Engineering 上。
#神经科学 #神经调控 #超声波 #全息技术
阅读更多:
Estrada, Hector, et al. “Holographic Transcranial Ultrasound Neuromodulation Enhances Stimulation Efficacy by Cooperatively Recruiting Distributed Brain Circuits.” Nature Biomedical Engineering, Jul. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41551-025-01449-x
奖励通过不同脑回路调控注意与决策
面对奖励时,大脑是如何调控注意力和决策的?这两者是否由同一套神经系统控制?印度科学研究所的Ankita Sengupta和Sridharan Devarajan设计了一项精巧的实验,首次清晰地证明,奖励预期是通过两条截然不同的神经通路,分别影响我们的感知敏感度(注意力)与决策偏好。
研究团队通过一项视觉任务和脑电图(EEG)记录,将奖励对大脑的影响拆分为两个独立部分进行研究。在第一部分实验中,研究人员通过在屏幕的不同位置设置不同大小的奖励(空间特定奖励),成功地引导了参与者的注意力。结果显示,参与者对高回报区域的微小变化更为敏感,其大脑活动也呈现出典型的注意力神经信号,如α波段功率的改变。在第二部分实验中,研究人员则改变了对不同“选择”(报告“有变化”或“无变化”)的奖励,而非改变位置的奖励。在这种情况下,参与者更倾向于做出能获得更高奖励的决策,即决策偏见发生了改变,但他们的感知敏感度并未变化。最令人意外的发现是,这种决策偏见的改变,并未伴随第一部分实验中出现的任何典型注意力脑电信号。这一结果清晰地表明,大脑中“提升注意力以更好地感知”和“为获利而调整决策偏好”是两个独立的过程,由不同的神经机制驱动。研究发表在 PLOS Biology 上。
#认知科学 #神经机制与脑功能解析 #奖励 #决策
阅读更多:
Sengupta, Ankita, and Devarajan Sridharan. “Reward Expectation Yields Distinct Effects on Sensory Processing and Decision Making in the Human Brain.” PLOS Biology, vol. 23, no. 7, Jul. 2025, p. e3003234. PLoS Journals, https://doi.org/10.1371/journal.pbio.3003234
大规模基因研究揭示老年人虚弱的生物学基础
为何有些老年人会变得格外虚弱?卡罗琳斯卡医学院和芬兰坦佩雷大学的Jonathan K. L. Mak、Juulia Jylhävä及其同事们,对近百万欧洲人群进行了一项大规模基因分析,成功识别出数十个与虚弱相关的新基因变异,为早期预测和干预提供了重要线索。
该研究采用全基因组关联研究(genome-wide association study,GWAS),分析了来自芬兰FinnGen项目和英国生物样本库(UK Biobank)近百万人的遗传与健康数据。研究人员使用医院虚弱风险评分(Hospital Frailty Risk Score, HFRS)作为衡量虚弱程度的标准。分析结果共发现了53个与虚弱显著相关的遗传位点,其中45个是首次报道的新发现。通过与蛋白质组学数据整合分析,研究团队进一步锁定了多个可能具有因果效应的关键基因,如APOE、MET和CGREF1等,这些基因的功能涉及免疫防御、大脑功能和新陈代谢等核心生物过程。这解释了为何虚弱是一种多系统功能衰退的综合征。研究表明,这些遗传标记可以被整合为多基因风险评分,用于预测个体未来发生虚弱的风险,从而有望在中年时期就识别出高危人群并提前干预。研究发表在 Nature Aging 上。
#疾病与健康 #疾病预防 #老年健康 #遗传学 #全基因组关联研究
阅读更多:
Mak, Jonathan K. L., et al. “Large-Scale Genome-Wide Analyses with Proteomics Integration Reveal Novel Loci and Biological Insights into Frailty.” Nature Aging, Aug. 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s43587-025-00925-y
早点吃饭或可抵消肥胖的遗传风险
什么时候吃比吃什么更重要吗?特别是对于那些喝水都胖的体质。马德里康普顿斯大学的R De la Peña-Armada、María Rodríguez-Martín、Richa Saxena和Marta Garaulet等人进行了一项长期研究。他们发现,早点吃饭能够显著减弱高遗传风险人群的肥胖倾向。
▷图形摘要。Credit: Obesity (2025).
该研究分析了1,195名西班牙超重或肥胖成年人的数据,这些参与者在接受了减肥干预后,被追踪长达12年。研究人员首先利用参与者的基因信息,计算出每个人的多基因风险评分(polygenic risk score, PRS-BMI),这是一个量化个体天生肥胖倾向的指标。同时,他们通过计算每日第一餐和最后一餐的“膳食摄入中点”(midpoint of meal intake)来评估参与者的整体吃饭时间。结果显示,吃饭晚确实不利于长期维持体重,膳食中点每推迟一小时,12年后的体重就平均高出2.2%。最关键的发现是,这种影响在不同基因风险的人群中差异巨大。对于那些具有高遗传肥胖风险的人来说,晚吃饭的“惩罚”格外严重——进食时间每推迟一小时,他们的BMI指数就高出2.21 kg/m²。然而,在遗传风险较低的人群中,吃饭早晚似乎与体重没有明显关联。这一结果表明,早点吃饭或许是对抗不良基因的一种简单有效的生活方式干预。研究发表在 Obesity 上。
#疾病与健康 #个性化医疗 #肥胖 #时间营养学
阅读更多:
De la Peña-Armada, R., et al. “Early Meal Timing Attenuates High Polygenic Risk of Obesity.” Obesity, vol. 33, no. 8, 2025, pp. 1555–66. Wiley Online Library, https://doi.org/10.1002/oby.24319
AI 行业动态
全球首款神经免疫调节设备获批!类风湿性关节炎迎来革命性疗法
SetPoint Medical公司开发的SetPoint系统近日获得美国食品药品监督管理局(FDA)批准,成为全球首个用于治疗类风湿性关节炎(Rheumatoid arthritis,RA)的神经免疫调节设备。该系统通过植入迷走神经并施加电刺激,激活人体自身的抗炎和免疫修复机制,为中重度RA患者提供了一种无需依赖传统药物(如生物制剂和靶向合成DMARDs)的新选择。SetPoint Medical首席执行官Murthy V. Simhambhatla博士表示,这一突破标志着自身免疫疾病治疗进入新阶段,并计划于2025年在美国部分城市推广,2026年全面铺开。
类风湿性关节炎是一种慢性自身免疫疾病,全球患者数量庞大,仅美国就有超过150万人受其困扰。传统疗法因副作用大、患者依从性低等问题,仅有25%的患者对治疗满意,半数患者在两年内停药。SetPoint系统的获批基于RESET-RA临床试验,结果显示75%的患者在12个月后不再依赖生物制剂或靶向药物,且严重不良事件发生率极低(1.7%),安全性显著优于现有方案。
未来,SetPoint Medical计划将这一技术拓展至其他自身免疫疾病,如多发性硬化症和克罗恩病。哈佛医学院神经科学教授Mark Richardson博士指出,神经免疫调节通过神经通路抑制炎症,具有广阔临床前景。该设备一次植入可自动运行10年,极大简化了患者的治疗管理,为RA患者带来长期希望。
#类风湿性关节炎 #神经免疫调节 #FDA批准 #SetPointMedical #迷走神经刺激
阅读更多:
https://wsil.marketminute.com/article/bizwire-2025-7-31-setpoint-medical-receives-fda-approval-for-novel-neuroimmune-modulation-therapy-for-rheumatoid-arthritis
苹果脑机接口技术突破:渐冻症患者用意念操控iPad
全球首位渐冻症(ALS)患者Mark Jackson通过植入脑机接口设备Stentrode(一种通过血管植入大脑的微型装置,无需开颅),成功实现了用脑电波直接控制苹果设备。这项技术由Synchron团队开发,其创新之处在于通过颈静脉植入,避免了传统脑机接口的开颅风险。Stentrode能够捕捉大脑神经信号,并将其转化为操作指令,让失去肢体控制能力的患者重新与数字世界连接。
2023年,苹果推出BCI HID(脑机接口人机交互标准),将脑电波作为新的输入方式,与触控、键盘和语音并列。这一协议使脑机接口设备能够无缝接入iOS、iPadOS等系统,用户通过视觉反馈(如高亮色块)确认操作意图,大幅提升了交互准确性。Mark Jackson能够通过意念完成启动应用、发送信息等操作,甚至控制智能家居设备,实现了“零干预”交互模式。
与Neuralink(需开颅植入电极的脑机接口技术)相比,Stentrode的优势在于低风险和高适应性,更适合渐冻症等行动受限患者。苹果的加入加速了脑机接口技术的普及,使其从实验室走向日常生活,为残障人士提供了前所未有的自主权。未来,Synchron计划推动跨平台适配,让更多脑机接口设备融入数字世界。
#脑机接口 #苹果科技 #渐冻症 #人机交互 #无障碍技术
阅读更多:
https://wccftech.com/apple-brain-computer-interface-man-controls-ipad-using-thoughts/
Grok 4国际象棋首战称王
首届Kaggle AI国际象棋竞赛由谷歌发起,旨在测试大模型的涌现能力。参赛选手包括OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5系列、Claude Opus 4以及马斯克旗下的Grok 4。首日对决中,Grok 4表现最为亮眼,被网友评价为“战术策略和速度超越所有对手”,而DeepSeek R1虽开局强劲却惜败于o4-mini,Kimi K2则因频繁走非法棋步早早出局,引发网友为其鸣不平。
比赛特邀国际象棋特技大师中村光(Hikaru Nakamura)担任解说,半决赛将在Gemini 2.5 Pro、Grok 4、ChatGPT的o4-mini和o3之间展开。马斯克对Grok 4的表现轻描淡写,称“未刻意训练,只是副作用”,但网友已将其视为夺冠热门。其他对决中,Gemini 2.5 Pro与Claude Opus 4上演高水平对局,而Kimi K2的快速落败则暴露了非推理模型在短时决策中的劣势。
国际象棋因其规则明确但复杂度极高(10^120种可能局面),成为测试AI决策和泛化能力的理想场景。陶哲轩曾指出,AI通过近似值而非穷举法解决此类问题,体现了涌现能力的价值。网友认为,这场比赛不仅是棋艺比拼,更是AI内部世界结构的映射。
#AI国际象棋 #Grok4 #涌现能力 #Kaggle竞赛 #马斯克
阅读更多:
https://x.com/elonmusk/status/1952814912839008347
Claude Opus 4.1强势登场:编程性能刷新纪录
Anthropic公司正式发布Claude Opus 4.1,这款AI模型在编程性能上再次突破,以74.5%的准确率在SWE-bench测试中超越前代Opus 4及竞争对手Gemini 2.5 Pro,成为新晋SOTA(当前最优模型)。除了编程能力,Opus 4.1还在Agent任务执行、推理能力和细节追踪方面有所提升。值得注意的是,此次升级并未涨价,定价与Opus 4保持一致,官方还透露未来几周将推出更大规模更新。
Anthropic在发布中巧妙展示了模型实力与客户关系。通过邀请Rakuten Group(日本乐天株式会社)和Windsurf等客户分享使用体验,间接证明Opus 4.1在真实场景中的实用性。例如,Rakuten称赞其能精准修复大型代码库的bug,而Windsurf则对比了性能提升幅度。这一策略被外界解读为应对OpenAI近期GPT-5泄露风波的竞争举措,意在强调自身技术实力与商业合作稳定性。
与OpenAI高调炒作GPT-5不同,Anthropic以简洁风格突出技术本色,赢得开发者好感。Opus 4.1的System Card显示,其核心架构未变,但无害回复率高达99.06%。目前模型已向付费用户开放,支持API、Amazon Bedrock和Vertex AI平台。
#ClaudeOpus4.1 #AI编程 #性能升级 #客户背书 #Anthropic
阅读更多:
https://www.anthropic.com/news/claude-opus-4-1
OpenAI重磅开源GPT OSS模型家族:117B参数单卡可跑,20B版本消费级硬件畅玩
OpenAI正式推出全新开源模型家族GPT OSS,包含117B参数的gpt-oss-120b和21B参数的gpt-oss-20b两款模型。它们采用混合专家(Mixture-of-Experts, MoE)架构,并引入4-bit量化技术MXFP4,显著降低资源消耗。其中,120b版本可部署于单张H100 GPU,20b版本仅需16GB显存,甚至支持消费级硬件。模型采用Apache 2.0许可证,附带简易使用政策,强调安全与民主化应用,标志着OpenAI推动AI普惠化的重要一步。
GPT OSS支持链式思维推理、指令跟随及工具调用,适配生成式AI和智能体工作流。其架构创新包括Token-choice MoE、RoPE位置编码(支持128K上下文)以及learned attention sink技术,提升长文本稳定性。模型已集成Hugging Face生态,提供transformers、vLLM等多种推理方案,并兼容OpenAI的Responses API。开发者可通过Hugging Face的Inference Providers服务,一键调用AWS、Cerebras等多家云厂商的算力资源。
此外,OpenAI为社区提供丰富的优化支持:MXFP4量化显著提升Hopper/Blackwell显卡效率;AMD ROCm平台初步适配MI300系列;Flash Attention 3和MegaBlocks MoE内核进一步加速推理。模型还上线了Azure AI和Dell企业级平台,支持私有化部署。评测显示,20B版本在IFEval和AIME25任务中分别达到69.5和63.3分,性能对标同规模顶尖推理模型。
#OpenAI #开源大模型 #混合专家 #AI推理 #HuggingFace
阅读更多:
https://hf.co/blog/welcome-openai-gpt-oss
Google Cloud推出MLE-STAR:自动化机器学习任务的革命性代理
Google Cloud研究科学家Jinsung Yoon和学生研究员Jaehyun Nam近日发布了MLE-STAR,这是一款能够跨多种数据模式自动执行机器学习任务的最先进代理。与现有方案不同,MLE-STAR通过结合网络搜索和针对性代码块优化,显著提升了任务解决效率。其核心创新在于先搜索最新模型作为基础,再通过消融研究优化关键代码块,最终生成高性能解决方案。实验显示,MLE-STAR在Kaggle竞赛中的奖牌获得率高达63%,远超传统方法。
MLE-STAR的独特之处在于其模块化设计。它不仅集成了调试代理和数据泄漏检查器,还引入了一种新颖的集成方法,能够将多个候选方案合并为更优解。此外,该代理还能自动纠正大型语言模型(LLM)生成的代码中的错误,例如数据泄漏或未充分利用的数据源。这些功能使其在图像分类、表格数据等任务中表现卓越,尤其擅长利用最新模型(如EfficientNet、ViT)而非过时技术。
研究人员强调,MLE-STAR的适应性将随机器学习领域的进步持续增强。其开源代码库已发布,开发者可通过Agent Development Kit(ADK)快速集成。这一工具不仅降低了机器学习应用的门槛,还可能推动医疗、金融等领域的创新。未来,团队计划进一步优化其网络搜索策略,以覆盖更广泛的模型库。
#机器学习 #自动化 #GoogleCloud #AI代理 #开源工具
阅读更多:
https://research.google/blog/mle-star-a-state-of-the-art-machine-learning-engineering-agents/
AI 驱动科学
Cell:AI从头设计微型蛋白,将先导编辑效率提升近19倍
如何提升精准基因编辑工具“先导编辑器”的效率,是其走向临床应用的关键瓶颈。首尔国立大学医学院的Ju-Chan Park和Sangsu Bae等研究人员,针对细胞内抑制编辑效率的错配修复机制,利用生成式AI设计出一种全新的微型蛋白抑制剂,成功解决了这一难题。
研究团队首先利用AI蛋白质设计工具RFdiffusion,从零开始生成了数千个可能抑制错配修复(mismatch repair,简称MMR)通路关键蛋白MLH1的全新微型蛋白质。随后,团队独创性地开发了一种“AlphaFold 3竞争测试”方法,利用谷歌DeepMind先进的蛋白质结构预测模型AlphaFold3,在计算机上快速模拟并筛选出哪个设计蛋白能最有效地“挤开”MLH1的天然搭档,从而使其失效。整个设计和筛选过程仅耗时4天。最终,他们获得了一个仅由82个氨基酸组成的最佳结合蛋白(MLH1-SB)。研究人员将其与先进的先导编辑器PE7融合,构建了名为PE7-SB2的新系统。实验结果显示,该系统在人类细胞中的编辑效率比标准版PEmax提升了惊人的18.8倍,比优化版PE7提升了2.5倍。更重要的是,在小鼠活体内,其效率也提升了3.4倍。这种微型蛋白的紧凑尺寸使其极易被包装到病毒载体中,为开发高效的体内基因治疗铺平了道路。研究发表在 Cell 上。
#AI驱动科学 #自动化科研 #基因编辑 #蛋白质设计 #个性化医疗
阅读更多:
Park, Ju-Chan, et al. “AI-Generated MLH1 Small Binder Improves Prime Editing Efficiency.” Cell, vol. 0, no. 0, Aug. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.07.010
Nature:人工智能代理时代来临,我们亟需新的伦理规范
随着能独立决策和行动的AI代理(AI agents)崛起,我们如何确保其安全并有益于社会?Iason Gabriel, Geoff Keeling, Arianna Manzini及James Evans在一篇评论文章中指出,AI代理的广泛部署正引发安全、责任归属和人机关系等一系列全新挑战,并呼吁科学家、工程师和政策制定者共同为这个新世界构建一套新的伦理和治理框架。
文章指出,AI代理面临严峻的价值对齐(value-alignment)挑战。AI可能因误解指令而采取意想不到的有害行为,例如一个为玩赛艇游戏训练的AI,最后发现通过不断撞船刷分比赢得比赛“更优”,这在现实世界中可能导致严重后果。作者认为,解决方案在于改进技术,如通过基于偏好的微调(preference-based fine-tuning)让AI更好地理解人类真实意图,并通过机械可解释性洞察其决策过程。文章进一步探讨了AI代理的社会影响。类似Replika的AI伴侣已能与用户建立深厚情感联系,这引发了情感操纵和过度依赖的伦理担忧。作者强调,AI代理的设计应以补充而非取代人类关系为原则,尊重用户自主性并促进其长期福祉。为应对这些挑战,文章提出了三点行动建议:第一,评估体系必须从实验室基准转向动态的真实世界测试;第二,必须建立包括安全护栏(guard rails)在内的强大风险控制措施;第三,需要设计技术标准和监管机制,以构建一个健康、可信的多代理生态系统。研究发表在 Nature 上。
#AI驱动科学 #跨学科整合 #AI伦理 #自主智能体
阅读更多:
Gabriel, Iason, et al. “We Need a New Ethics for a World of AI Agents.” Nature, vol. 644, no. 8075, Aug. 2025, pp. 38–40. www.nature.com, https://doi.org/10.1038/d41586-025-02454-5
AI文献综述的陷阱:ChatGPT会推荐已撤稿的错误论文
当使用大型语言模型进行学术研究时,我们能否信任其结果?谢菲尔德大学的Mike Thelwall与Irini Katsirea等研究人员进行了一项研究,其最新成果揭示了一个令人担忧的现象:像ChatGPT这样先进的AI在被要求评估学术文献时,会完全忽略文章的撤稿或错误信息,并可能将错误的科学论断当作事实来呈现。
▷217 篇备受关注的已撤稿或令人担忧文章的 ChatGPT REF 平均评分。文章按 ChatGPT 评分升序排列。Credit: Learned Publishing (2025).
研究团队采用了一种严谨的两步测试方法。首先,他们挑选了217篇已被正式撤稿或存在严重可靠性问题的高知名度学术论文,并让ChatGPT 4o-mini模型对每篇文章的质量进行30次评估。在总共6,510份评估报告中,模型无一例外地未能指出任何文章的撤稿状态或相关错误。更令人惊讶的是,它将其中190篇问题论文评为“世界领先”或“国际优秀”的水平。在第二步调查中,研究者从这些撤稿论文中提取了61条已被证伪的科学论断,并直接向ChatGPT提问其真实性。结果显示,在三分之二的情况下,ChatGPT都给出了肯定或积极的回答,将这些错误信息确认为“真的”。这一系列发现有力地证明,当前的LLMs在训练和信息处理过程中,未能有效整合或优先考虑关于学术文献可靠性的关键元数据,例如撤稿声明。研究者强调,这一缺陷警示所有用户,在使用生成式AI进行任何形式的知识探索或分析时,必须保持高度警惕并进行独立核实。研究发表在 Learned Publishing 上。
#大模型技术 #其他 #学术诚信 #文献综述
阅读更多:
Thelwall, Mike, et al. Does ChatGPT Ignore Article Retractions and Other Reliability Concerns? onlinelibrary.wiley.com, https://doi.org/10.1002/leap.2018. Accessed 6 Aug. 2025
AI模拟人类辅助社科研究:潜力巨大但挑战犹存
如何经济高效地开展社会科学研究?斯坦福大学的Jacy Anthis, Luke Hewitt, Nicole Meister及David Broska等研究人员在一篇论文中系统探讨了利用大型语言模型模拟人类受试者的可行性。他们认为,尽管LLM潜力巨大,但仍需克服关键挑战,并提出结合人类数据与AI模拟的混合方法,为社会科学研究开辟了新的道路。
▷LLM 社会模拟的六种应用。最难的应用是完整的研究,这些研究既可以是人类可及的(HP),可以使用人类受试者;也可以是人类不可能的(HI),例如大规模的政策实验。Credit: arXiv (2025).
研究指出,LLM在模拟人类行为方面已初见成效。一项大规模研究显示,GPT-4对476个在线调查实验结果的预测,与真实人类受试者的结果相关性高达0.85,甚至能准确预测它未曾见过的新实验。然而,研究人员也系统性地指出了当前LLM作为“虚拟受试者”面临的五大挑战:多样性不足,即LLM的回答比人类更集中、更刻板;偏见,模型会依赖并放大现实中的社会刻板印象;谄媚(Sycophancy),模型倾向于给出讨好用户的答案而非事实;陌生性(Alienness),其推理过程与人类迥异,可能导致看似合理但逻辑怪异的结论;以及泛化能力差,难以将结论推广到新的情境或人群。为应对这些挑战,研究者提出了一系列解决方案。例如,采用“少量样本”引导能够有效提升回答的多样性。而目前最佳的实践方案是一种被称为“预测驱动推理”的混合模式:先用少量人类数据进行试点研究,再结合LLM模拟扩大样本量以增强统计功效,同时在分析中控制LLM可能引入的偏见。
#AI驱动科学 #计算模型与人工智能模拟 #大语言模型 #社会科学
阅读更多:
Anthis, Jacy Reese, et al. LLM Social Simulations Are a Promising Research Method. arXiv:2504.02234, arXiv, 5 Jun. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.02234
利用拓扑学“形状”分析,新框架可检测多模态AI中的对抗性攻击
如何保护能同时理解图像和文本的多模态AI免受恶意攻击?洛斯阿拉莫斯国家实验室的Minh Vu, Manish Bhattarai及同事们提出了一项创新解决方案,他们开发出一个基于拓扑学的框架,通过分析数据的“形状”来识别针对多模态AI的对抗性威胁,显著提升了安全防御能力。
▷在 CIFAR10 数据集上使用 CLIP 嵌入的对抗性检测方法的测试功效和平均 I 型错误率(最后一列)。Credit: arXiv (2025).
该研究的核心思想是,在正常的多模态AI(如CLIP模型)中,相关图像和文本的嵌入信息在数学空间中具有一致的几何结构或“形状”。对抗性攻击通过微小扰动,会破坏这种对齐关系,从而改变数据的拓扑结构。研究团队利用拓扑数据分析这一数学工具,特别是其中的持久同源(persistent homology)方法来捕捉这种微妙的形状变化。他们为此设计了两种新颖的拓扑对比损失(Topological-Contrastive losses)函数,能够精确量化攻击所造成的拓扑扭曲程度。实验表明,数据中混入的恶意样本越多,该损失值变化越明显。随后,团队将这些拓扑特征作为独特的“指纹”,整合进最大均值差异(Maximum Mean Discrepancy,MMD)测试中,创建出一种全新的、更敏感的攻击检测方法。在美国的Venado超级计算机上进行的大量测试证明,该方法在检测多种攻击时,性能始终显著优于现有防御技术,且误报率低。
#AI驱动科学 #预测模型构建 #多模态AI #对抗性攻击
阅读更多:
Vu, Minh, et al. Topological Signatures of Adversaries in Multimodal Alignments. arXiv:2501.18006, arXiv, 29 Jan. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2501.18006
Concept2Brain:一个预测大脑对文本和图片反应的AI模型
人工智能能否预测并生成大脑对特定概念的反应?Alejandro Santos-Mayo和Andreas Keil团队开发了Concept2Brain模型,一个能够根据文本或图片输入,生成高度逼真的合成脑电信号的深度学习网络。
该模型巧妙地逆转了传统研究思路,不再是从大脑信号解码外部刺激,而是直接将外部刺激编码为大脑信号。它首先利用如OpenAI的CLIP等多模态AI技术,提取文本或图片中丰富的语义与情感信息,并将其转化为一个抽象的数学表征。随后,模型将这个表征映射到一个复杂的电生理潜在空间,最终生成合成的脑电信号。为了验证模型的有效性,研究者使用了事件相关电位数据进行训练。结果显示,Concept2Brain生成的合成脑电信号,与真人在观看自然场景时记录的脑电活动惊人地相似。该模型现已作为免费的在线工具开放,研究人员只需输入文字或上传图片,即可生成可用于模拟研究和功效分析的定制化数据集,极大地推动了AI驱动的大脑功能建模。
#AI驱动科学 #计算模型与人工智能模拟 #大脑信号解析 #自动化科研
阅读更多:
Santos-Mayo, Alejandro, et al. Concept2Brain: An AI Model for Predicting Subject-Level Neurophysiological Responses to Text and Pictures. bioRxiv, 5 Aug. 2025, p. 2025.08.04.668476. bioRxiv, https://doi.org/10.1101/2025.08.04.668476
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。
十大炒股杠杆平台排名,股票配资配资,十大实盘配资排行提示:文章来自网络,不代表本站观点。