- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 我国最大跨径组合梁独塔斜拉桥,隆中大桥顺利合龙:全长 4454 米、主跨 330 米、主塔高度 201 米
- 本站8月2日消息,央视新闻昨日(8月1日)报道,隆中大桥(原名牛首汉江特大桥)顺利合龙,该桥是我国最大跨径组合梁独塔斜拉桥。图源:央视新闻本站注:隆中大桥由中交二航局承建,位于湖北省襄阳市,全长4454米,两个主跨均为330米,属于襄阳207国道改建项目。207国道襄阳段改建工程起于鄂豫两省交界处的襄州区黄集镇,途经襄州、樊城、襄城、南漳、宜城5个县(市、区),全长约96公里,是襄阳市建设里程最长、投资规模最大、社会关注度最高的普通公路建设项目。隆中大桥的设计结合了襄阳历史文化底蕴,主塔采用“H
- IT业界 367 2024-08-05 21:42:02
-
- OpenDevin出技术报告了,大模型Agent开发者必读
- 热门通用大模型Agent平台。今年3月,「全球首位AI软件工程师」Devin引爆了AI圈。与此前AI编程助手不同的是,Devin并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。Devin的出世让我们领略了大模型Agent的强大能力。很快,业界就出现了众多尝试复刻它的开源项目,其中OpenDevin脱颖而出,受到了人们最多的关注。OpenDevin是一个开发通过软件与世界互动的通用智能体的平台,其特点包括:大模型Agent、接口和环境之间交互的交互机制;Agent可用的沙盒操作系
- 人工智能 1057 2024-08-05 21:40:01
-
- 目标时速 1000 公里!我国高速飞车低真空环境下系统集成演示验证试验成功
- 中国高速飞车取得突破一、系统集成演示验证试验成功据科技日报报道,中国航天科工集团有限公司与山西省合作的超高速低真空管道磁浮交通系统(以下简称高速飞车)全尺寸试验线(一期)项目,在山西省大同市阳高县成功完成低真空环境下系统集成演示验证试验,并通过山西省科技厅现场测试检查。这标志着该项目具备项目验收的条件。二、实现超导航行控制本次试验采用超导航行器,在全长2公里管线内完成低真空环境建立后,超导航行器启航,按照预定控制曲线受控航行、稳定悬浮并安全停止,最大航行速度和悬浮高度符合预设值,各系统工作正常,
- IT业界 400 2024-08-05 21:26:12
-
- 人类偏好优化算法哪家强?跟着高手一文学懂DPO、IPO和KTO
- 尽管收集人类对模型生成内容的相对质量的标签,并通过强化学习从人类反馈(RLHF)来微调无监督大语言模型,使其符合这些偏好的方法极大地推动了对话式人工智能的发展。但由于RLHF是一个复杂且常常不稳定的过程,关于直接使用优化函数将人类的偏好和模型的结果进行对齐的研究成为时下的热点问题。本文是huggingface上的一篇博客,针对时下常见的三种人类偏好优化算法进行了性能比较。作者进行了大量的实验,旨在通过不同的模型和不同的超参数,对无需强化学习(或偏好调整)就能调整语言模型的三种可行方法进行评估。这
- 人工智能 753 2024-08-05 21:19:22
-
- 小红书 11 周年信承认大公司病:官架子大、决策拖沓,需要重新出发
- 本站8月2日消息,据三言科技报道,在小红书迎来11周年之际,公司创始人毛文超(薯名:星矢)和瞿芳(薯名:木兰)在11周年信中坦承,随着公司的快速发展,小红书也出现了所谓的“大公司病”。信中提到,在去年两次走进小红书人的组织调研中,从同学的日常反馈中,看到那些偏离创业初心、徒增组织消耗的Badcase。“比如,有的同学官架子特别大,自己不下场,遇到困难只会push一线同学去干去做去解决;有的Leader每天把时间花在逐字逐句分析上层意图上,对已经影响用户体验的重要问题视而不见”。“还有一些负责人不
- IT业界 1068 2024-08-05 21:06:32
-
- 「两全其美」,从头设计分子,深度学习架构S4用于化学语言建模
- 编辑|KX生成式深度学习正在重塑药物设计。化学语言模型(CLM)以分子串的形式生成分子,对这一过程尤为重要。近日,来自荷兰埃因霍芬理工大学(EindhovenUniversityofTechnology)的研究人员将一种最新的深度学习架构(S4)引入到从头药物设计中。结构化状态空间序列(StructuredStateSpaceSequence,S4)模型在学习序列的全局属性方面表现卓越,那么S4能否推进从头设计的化学语言建模?为了给出答案,研究人员系统地在一系列药物发现任务上对S4与最先进的CL
- 人工智能 936 2024-08-05 20:58:22
-
- 大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度
- 基于Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16存储,模型大小约为350GB,而即使是英伟达最新的B200GPU内存也只有192GB,更不用说其他GPU和边缘设备。大模型压缩,即将大模型“瘦身”后塞进资源受限的场景,以减少模型存储、访存和计算开销。在尽量不损失模型性能的前提下,提高大模型推理吞吐速度,使大模型在物联网边缘设备、嵌入式机器人、离线移动应用等
- 人工智能 623 2024-08-05 20:56:12
-
- 大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好
- 面对当前微调大模型主要依赖人类生成数据的普遍做法,谷歌DeepMind探索出了一种减少这种依赖的更高效方法。如你我所见,大语言模型(LLM)正在改变深度学习的格局,在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能,但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务来说尤为明显,需要大量资源和专业知识。怎么解决呢?模型生成得合成数据是一种有潜力的替代方案,只要能保证数据的质量,就能实现可扩展性和成本效
- 人工智能 902 2024-08-05 20:48:40
-
- 新质互融,算力共振:玻色量子发布新一代550计算量子比特相干光量子计算机
- 2024年4月18日,北京玻色量子科技有限公司(以下简称“玻色量子”)以“新质互融,算力共振”为主题,在北京·望京成功召开2024年新品发布会,重磅发布了新一代550计算量子比特的相干光量子计算机——“天工量子大脑550W”及开物SDK等核心研究成果,充分展现出量子计算与AI的融合,是实用化量子计算的起点。2024年,量子技术作为未来产业、新质生产力发展的重要组成部分,北京未来产业布局中明确提出建
- 人工智能 1010 2024-08-05 20:43:00
-
- 苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
- 偷懒才能更好地工作。Llama3.1刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的8B版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和MetaAI的一个研究团队提出了一种新方法,可在保证准确度不明显下降的同时,将Llama2预填充阶段的推理速度提升到原来的2倍以上,这或许能为Llama3.1的加速提供一些启发。他们把这种方法称为LazyLLM,即懒惰大型语言模型。论文标题:LazyL
- 人工智能 569 2024-08-05 20:41:02
-
- 科技昨夜今晨 0805:全球首款 18650 钾电池问世;货拉拉司机拒运尸体遭投诉;阿维塔 11/12 增程版 9 月上市
- “科技昨夜今晨”时间,大家好,现在是2024年8月5日星期一,今天的重要科技资讯有:全球首款18650钾离子电池问世,可替代锂电池Group1公司宣布推出全球首款采用18650圆柱形外壳的钾离子电池,这一突破性进展有望为传统锂离子电池提供一种可持续且经济高效的替代品。>>查看详情泰国总理下令对拼多多旗下Temu进行调查:是否遵守法律并缴纳所需税款据Thaipbsworld报道,泰国总理赛塔・他威信(SretthaThavisin)已责成数字经济和社会部、税务局和警方调查拼多多旗下电商
- IT业界 1129 2024-08-05 20:38:50
-
- Nature子刊,快10倍,基于Transformer的逆向蛋白质序列设计方法
- 编辑|萝卜皮借助深度学习的进步,蛋白质设计和工程正以前所未有的速度发展。然而,目前的模型无法在设计过程中自然地考虑非蛋白质实体。在这里,瑞士洛桑联邦理工学院(EPFL)的研究人员提出了一种完全基于原子坐标和元素名称的几何transformer的深度学习方法,该方法可以根据不同分子环境所施加限制的主链支架,预测蛋白质序列。使用该方法,研究人员可以以高成功率生产出高热稳定性、催化活性的酶。这有望提高蛋白质设计流程的多功能性,以实现所需的功能。该研究以「Context-awaregeometricde
- 人工智能 945 2024-08-05 20:33:31
-
- 苹果首款折叠设备量产受阻,Jeff Pu称2025或2026年难以实现
- 8月3日消息,近日,MacRumors获取了海通国际证券分析师JeffPu向投资者发布的一份新报告,其中指出苹果首款折叠设备的量产计划已遭遇“推迟”,可能无法在预期的2025年或2026年实现量产。此前,JeffPu在5月份的报告中曾预测,苹果的首款折叠设备将于2025年和2026年开始进入量产阶段。他当时还预测,苹果可能会先推出一款大屏折叠iPad或MacBook,随后再推出一款市场潜力更大的折叠屏iPhone。这一系列的预测曾引发市场和消费者的广泛关注。然而,据小编了解,最新的报告却带来了一
- IT业界 400 2024-08-05 20:32:02
-
- Transformer作者回流谷歌,Character.AI创始团队被「收购」,只要人不要公司
- AI初创者的归宿还是大厂?一觉醒来,生成式AI的「吃鸡大赛」再次缩圈了。初创公司Character.AI周五宣布已与谷歌签署协议,谷歌将获得Character.AI的大型语言模型(LLM)技术的非独家许可。谷歌还宣布重新雇佣NoamShazeer和DanielDeFreitas。其中,NoamShazeer是Character.AI的创始人、CEO,也是Transformer论文作者之一,他曾在谷歌任首席软件工程师。而DanielDeFreitas是Character.AI的总裁,曾在谷歌担任高
- 人工智能 840 2024-08-05 20:17:10
-
- 高清视频竟不是真的,几张照片渲染的3D场景让你难辨真伪
- 请注意,上述动图完全是由多张照片渲染出来的3D场景。人类很难发现它们的破绽。那让我们一起看看,这种场景是怎样实现的。网格和点是最常见的三维场景表示法,因为它们是显式的,非常适合基于GPU/CUDA的快速光栅化。相比之下,最新的神经辐射场(NeRF)方法建立在连续场景表征的基础上,通常使用体积光线渲染优化多层感知器(MLP),对捕捉到的场景进行新视角合成。虽然这些方法的连续性有助于优化,但渲染所需的随机取样成本很高,而且会产生噪声。来自法国蔚蓝海岸大学的研究者引入了一种新方法,能够结合这两种方法的
- 人工智能 590 2024-08-05 20:15:51