首页 小说排行 小说分类 完本小说 用户中心 原创专区
佛系小说 > 其他类型 > 2024年行情 > 第1330章 DeepSeek震撼发布J

2024年行情 第1330章 DeepSeek震撼发布J

作者:一360一 分类:其他类型 更新时间:2025-03-06 19:20:40 来源:宝书网

一秒记住【宝书网】 lzbao,更新快,无弹窗!

人工智能(AI)的发展速度超乎想象,是不知疲倦的探索者,正以前所未有的力量推动着各个行业的变革。近期,DeepSeek公司凭借其R1大语言模型在华尔街掀起了一场风暴,引发了美国公司模型成本及人工智能股票泡沫破裂的广泛讨论,进而导致美股科技股抛售潮的出现。然而,这仅仅是DeepSeek带给我们的震撼的开始。

DeepSeek的R1大语言模型凭借其强大的性能,不仅震撼了硅谷,更让华尔街的投资者们措手不及。一时间,科技股纷纷下跌,其中芯片巨头英伟达股价暴跌约16.86%,单日市值蒸发约600亿美元(原文中的6000亿美元应为笔误,根据上下文及市场常识判断应为600亿美元),博通、超威半导体公司、美光科技、台积电等芯片及科技企业股价也纷纷走低。此外,与人工智能相关的衍生品,如电力供应商也未能幸免,美国联合能源公司和Vistra的股价分别下跌了20.85%和28.33%。这一系列连锁反应,无疑彰显了DeepSeekR1模型在业界的巨大影响力。

然而,面对这场风暴,白宫人工智能和加密货币总管DavidSacks却持乐观态度。他在社交媒体上表示,DeepSeekR1的表现证明了人工智能竞争的激烈程度,并认为美国总统特朗普废除拜登行政命令是正确的决定。Sacks认为,拜登的行政命令束缚了美国的人工智能公司,而DeepSeek等企业的崛起则展示了美国在该领域的强大实力。他强调:“我对美国充满信心,但我们不能自满。”

就在R1模型引发广泛讨论的同时,DeepSeek又在深夜放出了大招。1月27日晚间,DeepSeek创始人梁文锋在社交媒体上透露,新版本即将发布。仅仅三个多小时后,人工智能开源社区HuggingFace就展示了DeepSeek发布的一系列开源多模态模型,包括Janus-Pro和JanusFlow,这些模型的参数大小从10亿到70亿不等。这一消息再次震惊了业界,也让我们看到了DeepSeek在多模态领域的深厚积累。

本次发布的Janus-Pro系列模型,在文生图能力方面取得了显著突破。其中,70亿参数的Janus-Pro-7B在GenEval和DPG-Bench基准测试中,分别以80%和84.2%的准确率击败了OpenAI的DALL-E3和StableDiffusion等顶尖图像生成模型。这一成绩不仅证明了Janus-Pro的强大性能,也彰显了DeepSeek在多模态理解和生成方面的深厚实力。

据DeepSeek发布的报告介绍,Janus-Pro是此前发布的Janus模型的改进版本。相较于Janus,Janus-Pro在训练策略、训练数据以及模型规模等方面都进行了优化。这些改进使得Janus-Pro在多模态理解和文本到图像指令跟随能力方面取得了显著进步,同时提升了文本到图像生成的稳定性。

作为一种新颖的自回归框架,Janus-Pro将多模态理解和生成统一起来,通过解耦视觉编码来实现这一目标。它将视觉编码解耦为单独的路径,以解决以前方法的局限性,同时仍然使用单一、统一的转换器架构进行处理。这种设计不仅提高了模型的性能,还使得模型在处理多模态任务时更加灵活和高效。

值得注意的是,DeepSeek在训练Janus-Pro模型时投入了大量的计算资源。对于1.5B和7B这两个参数的模型,整个训练过程在16/32节点的集群上进行,每个节点配备8块NvidiaA100(40GB)GPU。经过7/14天的训练,DeepSeek就成功训练出了能够击败OpenAIDALL-E3和StableDiffusion的模型。这一成绩不仅彰显了DeepSeek的技术实力,也让我们看到了AI技术在不断突破极限。

除了强大的文生图能力外,Janus-Pro-7B还具备图像识别功能。它能够根据提供的图片猜测地点,并给出详细的描述和分析。例如,当给Janus-Pro-7B提供一张中国杭州西湖的图片时,它能够准确识别出图片中的景点是三潭映月岛,并进一步分析出图片中的建筑、湖水和山脉等特点。这一功能不仅展示了Janus-Pro-7B在图像识别方面的强大性能,也为我们带来了更加智能和便捷的图像处理体验。

事实上,DeepSeek一直在多模态领域进行探索和创新。去年,他们就推出了基于自回归的多模态理解与生成统一模型Janus。而进入2025年,他们将Janus进一步升级至Janus-Pro。这一系列动作不仅彰显了DeepSeek在多模态领域的深厚积累和创新精神,也让我们看到了AI技术在不断推动各个行业的变革和发展。

然而,尽管DeepSeek在C端应用上主要聚焦于文本能力,还无法直接生成图片或识别图像,但随着Janus-Pro的发布和技术的不断进步,用户或许很快就可以使用DeepSeek进行图像、视频等领域的创作。这将为用户带来更加智能和便捷的创作体验,也将推动AI技术在更多领域的应用和发展。

综上所述,DeepSeek凭借其强大的技术实力和创新精神,在多模态领域取得了显著突破。Janus-Pro的发布不仅为AI技术的发展注入了新的活力,也为我们带来了更加智能和便捷的生**验。在未来的发展中,我们有理由相信,DeepSeek将继续引领AI技术的潮流,推动各个行业的变革和发展。让我们共同期待AI技术为我们带来的更加美好的未来!

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报