2025
第19期--极光月全食
刊首图:极光月全食
闲情逸趣:梁文锋专题访谈
重点关注:
序号 | 标题 | 简述 | 位置 |
---|---|---|---|
1 | 5090显卡 | NVIDIA RTX 5090搭载了NVIDIA Blackwell架构,在性能、功耗效率、以及AI计算方面都有显著提升。 | 2-1 |
2 | Project Digits | 英伟达宣布将于5月推出名为“Project Digits”的个人AI超算,起价3000美元。该设备大小类似Mac Mini,配备GB10 Grace Blackwell超级芯片,支持最多128GB统一内存和4TB NVMe存储。 | 2-2 |
3 | GPT-4o原生出图 | GPT-4o支持了原生出图,它能够同时理解图像和文本,可以非常好地遵循提示词指令,轻松创作出虚实结合的场景。 | 2-5 |
4 | Gemini 2.5 | Gemini 2.5 Pro是一个‘思考’模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。它在多个基准测试中达到了SOTA水平,并且以显著的优势在LMArena上排名第一。 | 2-6 |
5 | Qwen2.5-Omni | 阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B,仅靠一个一体式模型,就能搞定文本、音频、图像、视频全模态,并实时生成文本和自然语音。 | 2-7 |
6 | Qwen2.5-VL-32B | 发布全新Qwen2.5-VL-32B-Instruct模型,针对视觉任务进行了强化学习优化,显著提升了人类偏好对齐和数学推理能力。 | 2-8 |
7 | DeepSeek-V3-0324 | DeepSeek发布了新版本模型 DeepSeek-V3-0324,该版本借鉴了DeepSeek-R1中的强化学习技术,并在多个任务上进行了深度优化,在推理能力、数学与代码方面实现了显著提升,整体性能超越GPT-4.5。 | 2-9 |
8 | MiniCPM-o | MiniCPM-o系列模型可以以端到端方式,接受图像、视频、文本、音频作为输入,并生成高质量文本和语音输出。 | 4-8 |
9 | Frappe Gantt | Frappe Gantt是一款开源的JavaScript 甘特图库,具有简洁的界面和丰富的交互功能。 | 4-11 |
10 | DeepSeek-R1 | 发布DeepSeek-R1模型,并同步开源模型权重。据官方介绍,它在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,性能比肩OpenAI o1正式版。 | 4-15 |
11 | XGrammar | XGrammar 结合 LLM 推理引擎,它能够在端到端低延迟 LLM 服务中实现近乎零额外开销的结构化生成。 | 4-16 |
12 | Unsloth | Unsloth可以比HuggingFace快2-5倍的微调Llama 3.3、Mistral、Phi-4、Qwen 2.5和Gemma等大语言模型,同时内存消耗减少80%。 | 4-18 |
13 | KTransformers | KTransformers旨在优化大模型的本地推理体验,特别是支持DeepSeek-R1等MoE大型语言模型的高效运行。它的性能较llama.cpp大幅提升,尤其在Prefill阶段,速度提升高达27.79倍。 | 4-19 |
14 | open-infra-index | DeepSeek 开源的 open-infra-index 项目为 AGI 研究和开发提供了重要资源。该团队公开了5个经过生产环境验证的存储库,并配备完善的文档与部署支持,展现了他们在 AGI 领域的关键进展。 | 4-23 |
15 | Spark-TTS | 一款高质量语音合成系统,它不仅支持零样本语音克隆,还能进行细粒度语音控制,包括语速、音调、语气等多项参数调节,同时具备跨语言生成能力,让 AI 语音变得更加灵活、多样化。 | 4-24 |
16 | SenseVoice | 具有音频理解能力的音频基础模型,包括语音识别、语种识别、语音情感识别和声学事件分类或声学事件检测。 | 4-25 |
17 | OrbStack | 一款专为macOS设计的快速、轻量级且易于操作的Docker容器工具,官方声称它比DockerDesktop速度更快。 | 5-3 |
18 | BewlyBewly | 一个用于 BiliBili 的浏览器扩展,旨在通过重新设计 BiliBili 用户界面来提升用户体验。 | 5-6 |
19 | PaSa | 由大型语言模型支持的高级论文搜索Agent。它可以自主地做出一系列决策,包括调用搜索工具、阅读论文、选择相关参考文献等,最终为复杂的学术查询获得全面准确的结果。 | 5-10 |
20 | Repomix | 一个专门用于将整个代码库打包成单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型进行分析和处理。 | 5-16 |
21 | KubeSphere | KubeSphere是在Kubernetes之上构建的面向云原生应用的分布式操作系统,完全开源,支持多云与多集群管理,提供全栈的IT自动化运维能力,简化企业的DevOps工作流。 | 5-18 |
22 | KubeKey | KubeKey是个轻量级安装工具,它提供了一种灵活、快速、方便的方式来安装Kubernetes、Kubernetes和KubeSphere,以及相关的云原生附加组件。 | 5-19 |
23 | AigcPanel | AigcPanel是一个简单易用的一站式AI数字人系统,小白也可使用。 支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。 | 5-20 |
24 | Open WebUI | Open WebUI 是一个可扩展、功能丰富、用户友好的自托管 AI 平台,旨在完全离线运行。 | 5-31 |
25 | GPUStack | 一个用于运行 AI 模型的开源 GPU 集群管理器,支持管理 Apple Mac、Windows PC 和 Linux 服务器上不同品牌的GPU。 | 5-32 |
26 | ESP-Drone | 这是一个基于 ESP32 的开源无人机项目,帮你制作一款低成本、可手机控制的小型无人机。 | 5-34 |
27 | Cherry Studio | 一款支持多个大语言模型服务商的桌面客户端,兼容 Windows、Mac 和 Linux 系统。 | 5-35 |
28 | Open Canvas | 由LangChain团队开发的应用,旨在服务于文档编辑、内容创作和编程,同时提供强大的协作能力。 | 5-36 |
29 | Clash Verge | Clash Verge是Clash内核的GUI图形客户端,分流规则功能强大且支持多种代理协议。 | 5-37 |
30 | Foundations-of-LLMs | 内含《大模型基础》开源书籍,该书是由浙江大学 DAILY 实验室开源的大语言模型教材,项目内还有LLM方向的经典论文、Arxiv前沿论文的收集。 | 6-2 |
31 | zh-style-guide | 技术文档写作规范指南,旨在为中文技术文档的语言风格、结构样式、内容元素、标点符号、格式排版等方面提供参考规范。 | 6-4 |
32 | DeepSeek的提示库 | DeepSeek官方文档里提供的一些特定场景需求的Prompt,可以参考它来写出高质量的提示词。 | 6-5 |
33 | 低代码编程受困于形式 | 低代码编程有先天缺陷,恐怕不会成功,程序员应该谨慎开发这类工具,付出的劳动很可能打水漂。 | 7-7 |
PDF版本下载:第19期--极光月全食 PDF版
第20期--天津海棠花节
未完待续...