目录

2025-02-12-新纪天工-开物焕彩致敬开源的力量一次震撼心灵的科技之旅

新纪天工 开物焕彩——致敬开源的力量:一次震撼心灵的科技之旅

https://i-blog.csdnimg.cn/direct/5fbef82f91ea4bb0898b1a9482d31b5c.jpeg#pic_center


写在前面

说到开源大多数人都不陌生,大家对这个词汇最普遍的认识就是将某个软件的源代码或者说开发过程公布出来,而这个理解也是完全正确的。“开源”即“开放源代码”(Open Source),是一种软件开发和分发的方式,其核心在于软件的源代码对公众是开放和可获取的。这里面包括程序的设计逻辑、算法、数据结构等核心信息。伴随着信息技术的发展,开源历经 Linux 等开源项目的崛起,到在操作系统、数据库、云计算、人工智能等多个领域的广泛应用,开源项目、开源社区、开源基金会等开源生态也逐渐构建和完善。

随着行业发展,越来越多的优秀开源项目、社区涌现出来。每年还会选出最为优秀几个的前沿科技代表录入开源创新榜单 (文末附 2024 年开源创新榜单) ,为我们展示开源创新技术的“年度最佳”。

2024 年12 月 28 日首场重大科技成就发布会在国家科技传播中心召开,作为一个专注于展示和推广具有标志性、战略性、引领性的科技成就的盛会,本次会议以“新纪天工 开物焕彩——致敬开源的力量”为主题,依托于 2024 年开源创新榜单,聚焦开源这一科技创新的重要协作模式,展示了中国算力网开源开放试验场、星辰语义大模型平台、书生大模型、“香山”开源高性能 RISC-V 处理器核等四项重大科技成就。作为一名科技爱好者,能够亲眼见证并感受那些前沿科技成果的发布,无疑是一次难得的体验。

成就一:中国算力网(C²Net)开源开放试验场科技成就

第一个展示的是中国算力网(C²Net)开源开放试验场,是利用新一代通信、网络技术实现国家大型算力高速互联的数字经济基础设施。

https://i-blog.csdnimg.cn/direct/248955967d0748fc8cc0308eb33c4b5c.png#pic_center

据专家介绍,C²Net 在系统软件层面,研发了广泛兼容多种异构国产智能芯片的系统软件栈,实现了国产集群的云化纳管与云际化任务调度。可支持华为等国产算力芯片,为国产算力芯片提供了强大的支持平台。预计到 2025 年将提供超过 100 万卡时的普惠算力,为大规模开源开发者提供算力支持。

对于像我这样的技术爱好者或初创企业来说,直接接入大型算力资源往往面临高昂的成本和技术壁垒。而C²Net通过开源开放试验场,提供了易于接入、使用成本相对较低的算力资源,使得我们能够更轻松地开展算法测试、模型训练等实验,极大地降低了技术创新的门槛。在C²Net的试验场上,我们还可以发布自己的研究成果、经验分享,同时也能学习到他人的优秀实践。这种互动不仅加速了技术迭代,也为跨领域、跨行业的合作提供了可能,拓宽了个人的视野和合作网络。

https://i-blog.csdnimg.cn/direct/c0191897d08b4f868ff63333445aa137.png#pic_center

此外试验场在应用服务和开源生态方面,研发了涵盖模型训练、微调与部署等全流程工具链,为开发者提供了从模型训练到部署的全方位支持,降低了开发门槛,大大提高了开发效率。从另一种角度来讲,中国算力网(C²Net)的开源开放试验场也为广大科技爱好者提供了一个学习、实践、创新的多维度平台,它不仅是技术进步的加速器,也是个人能力提升的催化剂。

成就二:星辰语义大模型平台科技成就

星辰语义大模型平台是由中国电信人工智能研究院(TeleAI)基于与北京智源人工智能研究院联合研发的 Tele-FLM 系列模型中的 TeleChat-52B 打造的通用生成式语义大模型对话平台。

以往对于大模型我比较熟悉的更多是百度文心一言,而这次通过专家们的介绍我了解到了很多星辰语义大模型独特的地方。首先它是首次提出了缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,降低了AI大模型的幻觉率,使模型更加理解问题语境,避免回答出一些莫名其妙的答案。其次在保证训练精度的前提下,利用多种优化手段提升模型训练效率和稳定性,实现了 GPU 同等算力计算效率的 93% 以上,同时模型有效训练时长占比达到 98% 以上。

https://i-blog.csdnimg.cn/direct/5e4fd742c7b94f05833716fb5a794d3e.png#pic_center

而对于知识问答、日常对话、文本生成、逻辑推理、数学计算、代码辅助、党建公文写作等通用能力星辰语义大模型也是不在话下,同时还支持基于 RAG 技术的知识库、文章的挂载问答,以及互联网检索功能,应用场景很是丰富,我已经迫不及待想要上手体验星辰语义了。

成就三:书生大模型科技成就

https://i-blog.csdnimg.cn/direct/05b540eceead4e6da2d8676eb69f821f.png#pic_center

书生大模型是由上海人工智能实验室(SAIL)主导开发的一系列预训练语言模型,在自然语言处理领域取得了显著的科技成就。在性能方面,书生大模型在多个自然语言处理任务中展现出优异的性能,包括文本分类、情感分析、问答系统和机器翻译等。其性能在多个评测中达到世界领先或先进水平,如 InternLM2.5 在数学推理能力上表现出色,性能优于 Llama3 和 Gemma2-9B 等同类模型。书生大模型还提供了不同量级的模型,如轻量级的 InternLM-7B、中量级的 InternLM-20B 和重量级的 InternLM-123B,满足了不同应用场景的需求。

不仅如此书生大模型提供了从数据、预训练、微调到部署和评测的全链条开源工具体系,从模型训练到部署的全链条都向用户开放,这无疑促进了技术的共享和创新,还为我们提供了丰富的资源和工具,降低了技术门槛。

https://i-blog.csdnimg.cn/direct/7af77170b69345eb800bd2b94738460c.png#pic_center

目前书生大模型已经应用于多个领域,如自动驾驶、智慧医疗、地球科学等,也为人们的生活带来了便利和智能化体验,如智能客服、多语种翻译等应用场景的出现,提升了人们的生活质量。

成就四:香山:开源高性能 RISC-V 处理器

“香山”开源高性能 RISC-V 处理器是中国科学院计算技术研究院、北京开源芯片研究院、中国科学院大学联合推出的重要项目。从2021年第一代“雁栖湖”、2023年第二代“南湖”、2024年第三代“昆明湖”处理器系列的发布,其性能已经比肩甚至优于部分国际主流处理器内核。该项目采用开源模式,提供了可配置和可扩展的 SoC 解决方案,支持更高性能的芯片设计,这也促进了 RISC-V 指令集架构在中国的普及与发展。

https://i-blog.csdnimg.cn/direct/0b00c6f96d1042e48ec7a2dc5ec68844.png#pic_center

香山处理器在追求高性能的同时,也注重了效率和功耗的平衡。这种设计理念让我深感赞赏,在现代计算环境中,高性能和低功耗已经成为处理器设计的两大核心挑战。香山处理器通过采用先进的架构设计和优化技术,成功地实现了性能与效率的平衡,为用户提供了更加高效、节能的计算体验。

不仅如此,它也给我在学习和工作上带来了诸多启发。首先它让我更加深入地了解了RISC-V架构的特点和优势,为我未来的学习和研究提供了宝贵的参考和借鉴。其次香山处理器的开源模式也启发了我对于技术合作和共享的认识,让我更加注重与他人的交流和合作,共同推动技术的进步和发展。

2024 年开源创新榜单

2024 年开源创新榜单由中国科协科学技术传播中心、中国计算机学会、中国通信学会、中国科学院软件研究所共同主办,中国开发者社区承办,面向中国开源行业领域,遴选具有创新性、贡献度和影响力的开源项目、社区、应用场景与开源事件,王怀民院士为首组建评审委员会,经研讨评审,评审出 10 个年度开源项目、10 个年度开源社区、10 个年度开源应用场景与 10 大年度开源事件。“重大科技成就发布会(首场)”活动依托于 2024 年开源创新榜单,旨在致敬中国开源力量,传播推广开源科技成就,营造中国开源创新生态。2024 年详细榜单如下:

❶ 年度开源项目

  • KubeEdge
  • JumpServer 开源堡垒机
  • Apache RocketMQ
  • Apache Seata
  • StarRocks
  • Apache StreamPark
  • “香山”开源高性能RISC-V 处理器核
  • MetaGPT
  • JuiceFS
  • Karmada

❷ 年度开源社区

  • 开源社
  • openKylin 社区
  • 昇思 MindSpore
  • TiDB 社区
  • 木兰开源社区
  • deepin(深度)社区
  • 书生大模型开源社区
  • RT-Thread 嵌入式操作系统社区
  • OpenBMB
  • Apache SeaTunnel 社区

❸ 年度开源应用场景

  • 奥升充电桩平台
  • 中国算力网(C²Net)开源开放试验场
  • openGemini
  • 开源自主工业仿真软件研发生态平 FastCAE
  • CubeFS
  • 隐语 SecretFlow
  • 基于 openEuler 的电网企业信创云
  • 句子互动大模型数字员工
  • HiSpark-Pegasus 智能小车
  • 星辰语义大模型平台

❹ 年度开源事件

  • 各地政府出台促进开源发展的政策
  • 中国发布首个开源许可证框架国家标准
  • 多家机构发布开源发展报告
  • 开源大模型成为重点开源产品年度热点
  • 中国开源操作系统根社区扎根行业应用
  • 硬件开源发展活跃
  • 多场开源发展大会成功举办
  • 全国开源公益性赛事多维度鼓励选拔优秀开源人才
  • 系列高校行活动促进开源教育
  • 多场国际开源活动在中国举办

开源,不仅是技术的共享,更是智慧的碰撞与融合。重大科技成就发布会聚焦国家战略需求和科技发展趋势,展示和推广具有标志性、战略性、引领性的科技成就,值得我们持续关注。本次参会对我来说是一次极为难得且意义非凡的经历。它不仅让我见证了开源创新的巨大力量,更让我深刻体会到了创新驱动和合作共赢的重要性。

68747470733a2f2f626c6f672e:6373646e2e6e65742f77656978696e5f35333037323531392f:61727469636c652f64657461696c732f313434373030353332