第18期--无界雕塑作品
一、刊首图
甘肃省瓜州县的戈壁滩上,有一座6000多根白色钢管搭建的雕塑作品《无界》,象征唐代的边关
二、时事新闻
紫金山-阿特拉斯彗星(国际编号C/2023 A3)10月9日进入近地点,直到26日离开。这段时间内,肉眼可以清晰看到。这几天,世界各地的天文爱好者拍下了许多照片。它的轨道周期是6万多年,上次光临地球的时候,人类还是石器时代。
2024.10.14,OpenAI 推出了的一项名为“Canvas”的新功能,它提供了一种新的交互方式,用于与ChatGPT在写作和编程项目上进行更好的协作,比如选定内容,进行针对性修改。
[1] 在写作场景下,可以进行的操作包括:
- 建议编辑:针对选中内容,ChatGPT 提供内联建议和反馈。
- 调整长度:将文档内容修改为更长或更短。
- 更改阅读等级:调整阅读级别,小学、初中、大学、研究生等。
- 最终润色:检查语法、清晰度和一致性。
- 添加表情符号:添加相关表情符号以强调重点和颜色。
[2] 在编程场景下,Canvas 修改和迭代模型生成的代码变得更加容易,具体可以进行的操作包括:
- 审查代码:ChatGPT 提供内联建议来改进代码。
- 添加日志:插入打印语句,帮助用户调试和理解代码。
- 添加注释:为代码添加注释,使其更易理解。
- 修复 bug:检测代码,如果有问题会重写以解决错误。
- 转换为其他语言:将代码移植为 JavaScript、TypeScript、Python、Java、C++或PHP等多种语言。
2024.10.8,2024年诺贝尔物理学奖揭晓。John J. Hopfield、Geoffrey E. Hinton获奖,以表彰他们在“基于人工神经网络的机器学习的基础性发现和发明”做出了重大贡献。
为什么将诺贝尔物理学奖授予研究人工神经网络的学者?诺贝尔奖委员会解释,是因为人工神经网络是用物理学工具训练的。也就是说,目前红遍全世界的人工智能的原始基础是物理学的发现和知识,机器学习模型是基于物理原理实现的。
2024.10.9,2024年诺贝尔化学奖授予了三位科学家,表彰他们在蛋白质设计和预测领域的突破性贡献。美国科学家 David Baker 因成功构建全新蛋白质获得一半奖金;英国科学家 Demis Hassabis 和美国科学家 John Jumper 因开发 AI 模型 AlphaFold2,解决蛋白质结构预测的难题,共享另一半奖金。此次奖项强调了蛋白质作为生命重要化学工具的关键性作用,得主们破解了蛋白质复杂结构的密码,推动了这一领域的发展。
2024.11.1,OpenAI正式发布了ChatGPT网络搜索功能,能实时、快速获取附带相关网页来源链接的答案。
三、技术文章
四、开源组件
1、ragas
Ragas是一个用于评估检索增强生成流程的框架,旨在帮助用户量化和改善RAG应用的性能。它可以集成到CI/CD中进行持续监控,并提供如ragas_score、context_precision等评估指标。
这是一个可在资源受限的设备上运行的小型视觉语言模型,它能够理解并生成与图像相关的自然语言描述,支持图像识别、生成描述和问答等功能。
这是一个用于定制网页音频和视频播放器界面的库,兼容各种 JavaScript 框架。它高度可定制,开发者可以轻松调整组件的外观和功能,支持字幕、投屏、快捷键、倍速、预览缩略图、移动端和静音按钮等功能。
4、Amphion
Amphion是一个音频、音乐和语音生成工具包。它的目的是支持可重复的研究,并帮助初级研究人员和工程师进入音频、音乐和语音生成研究和开发领域。
文档布局分析工具,通过多样化的合成数据和全局到局部的自适应感知增强文档布局分析,提升处理速度和准确性。论文地址
是阿里巴巴读光OCR团队维护的开源项目,旨在构建具备高级智能的系统,赋予机器阅读、思考和创造的能力。
MimicTalk是由浙江大学与字节跳动的联合研究团队开发的,它能够在短短15分钟内生成个性化和富有表现力的3D说话人脸视频。这项技术通过利用基于神经辐射场(NeRF)的泛化模型,结合静态-动态混合适应流程和上下文风格化的音频到运动模型,实现了对目标身份的静态外观和动态特征的快速学习与模仿,显著提高了视频质量、效率和表现力,超越了以往的个性化说话人脸生成方法。论文地址
PromptFix是一款基于扩散模型的图像处理工具,旨在根据用户的指令处理受损的图像并去除不需要的元素。它具有多种功能,包括图像上色、物体去除、去雾、去模糊、水印去除、雪花去除和低光增强等。该工具利用20步去噪过程,能够在修复图像缺陷的同时保留原始结构,并且适用于不同的纵横比。官方介绍
InstantIR是一种基于扩散模型的盲图像恢复方法,能够在测试时处理未知退化问题,提高模型的泛化能力。该技术通过动态调整生成条件,在推理过程中生成参考图像,从而提供稳健的生成条件。官方介绍
10、AlphaFold3
获得2024诺贝尔生物学奖的AlphaFold3蛋白质结构预测项目开源了(模型权重未直接放出,需要申请),它不仅能够预测蛋白质结构,还能预测其与DNA、RNA和其他蛋白质的相互作用,对于药物发现领域具有重大意义。论文地址、在线体验
11、Docling
Docling是一个文档解析和转换工具,能高效地将多种格式的文档(PDF、DOCX、PPTX、图片和HTML)解析导出为Markdown或JSON格式。Docling支持高级PDF理解、OCR功能,能与LlamaIndex和LangChain等工具集成,增强文档的检索和问答能力。技术报告
开源的命令行工具,使用 LLM 翻译 PDF 文件,可以完整保留排版。
五、工具软件
1、Rufus(开源)
Rufus是一款老牌的USB启动盘制作工具,可以将Windows、Linux等系统的ISO格式的镜像制作成USB启动盘。
2、LabelU(开源)
LabelU是一款综合性的数据标注平台,专为处理多模态数据而设计。该平台旨在通过提供丰富的标注工具和高效的工作流程,帮助用户更轻松地处理图像、视频和音频数据的标注任务,满足各种复杂的数据分析和模型训练需求。在线体验
3、Cursor(免费)
Cursor是一款基于人工智能技术的代码生成工具,它能够根据开发者的需求和上下文,智能地生成高质量的代码片段。无论是初学者还是资深开发者,都可以通过Cursor快速完成复杂的编程任务,提高开发效率和质量。
4、Docmost(开源)
个基于浏览器的维基和文档工具,Confluence 和 Notion 替代品。
5、notifier(开源)
一个 Cloudflare Worker 应用,监听 GitHub 仓库的各种事件,自动发送信息到 Telegram。
6、wechat-article-exporter(开源)
开源的微信公众号文章在线导出工具,可用来批量下载某个公众号的文章。
7、beszel(开源)
量级高颜值的 Docker 监控平台。这是一个轻量级的服务器监控平台,包括 Docker 统计、历史数据和警报功能。它拥有友好的 Web 界面,配置简单、开箱即用,支持自动备份、多用户、OAuth 认证和 API 访问等功能。
8、gophish(开源)
该项目提供了一个开箱即用的网络钓鱼平台,可用于模拟钓鱼攻击。它拥有友好的 Web 管理后台,支持邮件模板、批量发送邮件、网站克隆和数据可视化,适用于企业安全培训和渗透测试等场景。
9、kubernetes-goat(开源)
该项目是用于构建漏洞百出、易受攻击的集群环境,让开发者可以在真实场景中学习 K8s 攻击和防御技巧。
10、GoGoGo(开源)
该项目是一个基于 Android 调试 API 和百度地图实现的虚拟定位工具,无需 ROOT 权限即可修改地理位置。它支持位置搜索和手动输入坐标,并提供了一个可自由移动的摇杆来模拟位移。
11、oha(开源)
这是一个用 Rust 开发的 HTTP 请求压测工具,它操作简单、带 TUI 动画界面,支持生成请求延迟、吞吐量等指标的报告,以及动态 URL 和更灵活的请求间隔等功能。
12、BilibiliSponsorBlock(开源)
这是一款能够自动跳过 B 站视频中恰饭片段和开场、结尾动画的浏览器插件,所有标注数据均由网友贡献。Chrome插件商店安装
13、PgManage(开源)
一个跨平台的 Postgres 数据库的桌面客户端,提供图形界面。
14、dockerc(开源)
该项目能将 Docker 镜像转化为二进制可执行文件,无需配置 Docker 环境或安装依赖,简化了软件的分发和运行流程。
15、 Zed(开源)
Zed 是一款支持多人协作的代码编辑器,底层采用 Rust,主打 “高性能”,充分利用多核 CPU 和 GPU,追求极致性能,速度极快。
16、302.AI(开源)
302.AI 是一个“AI应用超市”,官方把它的应用都开源出来了,你可以基于Next.js在这基础上二次开发自己的AI应用。官方体验
17、Electronic-Component-Sorter(开源)
一个本机的 AI 工具,用摄像头识别电子元件。
18、Exo(开源)
Exo是一款实验性软件,允许用户通过家中的常见设备(如iPhone、iPad、Android、Mac、Linux 等)组建自己的AI 集群,进而将这些设备统合为一个强大的GPU。
19、kkTerminal(开源)
一个开源的网页终端,在网页上通过 SSH 连入远程主机。
六、学习资源
1、开源许可证选择器(中文)
回答几个问题,帮你选择一个开源许可证。
2、Prompt_Engineering(英文)
这份教程致力于帮助用户掌握与LLM沟通的技巧。内容涵盖从基础到高级的提示工程技术,附有详细的实现指南和示例代码。
3、逆向工程教程(英文)
面向初学者的逆向工程英文电子书,涵盖了 x86 和 ARM 架构。
七、生活经验
1、中国天眼阵列
“中国天眼”是世界最大的射电望远镜之一,直径500米。为了提高分辨率,天文台决定在周边的山头上,再建设24台直径40米的射电望远镜。这样的话,一共25台射电望远镜,组成一个阵列,可以大大提高太空图像的清晰度。
2、拉格朗日标准模型
拉格朗日标准模型是一个描述粒子行为的统一方程,非常复杂。这个方程有几十行,分成5个部分。尽管如此,它依然是描述粒子行为最简单、最紧凑的形式。
3、地震地图
这个网站是地震地图,标识出了1980年后大于5.2级的地震,可以清晰地看到地震带,也可以查看某个地区发生过的地震。
八、闲情逸趣
九、数字与言论
1、工程团队可以分为防守和进攻两种角色。进攻角色负责开发新产品和增加功能,防守角色负责维护产品。这两个角色都很重要,但是公司往往更重视进攻角色。——《将工程团队分为防守和进攻》
2、简单的东西很难卖出去,因为简单的东西看起来很容易,谁愿意为容易买单呢?商人们早已明白这个秘密,容易的东西往往被包装成复杂的东西,让用户觉得它很特别,从而为这种特别性付出高价。——《贩卖复杂性》
3、创业者的工作重点始终是优化业务,而不是优化代码库,除非代码库就是你的业务。—— 《使用 HTMX 构建 SaaS 产品》
4、我热爱消费者市场,讨厌企业市场。我们推出了一种产品,告诉每个人,大家自己决定要不要买,这很简单。但是,企业市场不是这样,使用产品的人自己做不了主,而做主的人不使用产品。——乔布斯
5、一项美国的调查发现,81%的公司发布过虚假的招聘广告,目的有几个:(1)在招聘网站持续亮相,(2)建立人才库,(3)让现有员工感到自己是可替代的,从而不敢松懈。——《幽灵工作对科技从业者的破坏》
6、现代硬件的速度快得难以置信,苹果的 M1 Max 芯片运行频率为 3.2GHz,即每秒32亿个时钟周期。然而,我用它打开微软的 Teams 需要3秒,我不相信这需要花费96亿个时钟周期。——preyneyv.dev
7、美国心理学会的一项研究表明,消耗脑力的思考,会导致烦躁、沮丧或其他负面情绪,所以“思考不利于健康”这个观点是对的。——合众社报道