2024.07-09--第17期

一、刊首图

二、时事新闻

1、环保奥运会

巴黎奥运会将于7月26日开幕。组委会宣布,这是一届环保的奥运会。但是,它的环保措施让人有一种简陋的感觉,似乎更大的目的是为了省钱,毕竟巴黎市的财政并不宽裕。这次的奥运村不是专门新建的,而是现有楼房改建的,阳台也是改建过程中添加的简易阳台。室内就更简单了,床是纸板床,甚至椅子也是纸板做的,所有房间都没有装空调。

2、萝卜快跑无人驾驶出租车

萝卜快跑无人驾驶出租车,正在街头接送乘客,不过目前还不是彻底的无人驾驶,每辆车都有人在云端监控,紧急情况下会远程接管。萝卜快跑现在12个城市运营,其中4个城市是车内无人,其余都是车内有安全员。武汉是唯一可以全市范围内 7X24 小时运营的城市,其余均只能在指定区域的部分时段内运营。武汉的政策最宽松,2022年就发布了“三个允许”:允许车内无安全员、允许开上社会道路、允许商业化服务。

萝卜快跑无人驾驶出租车

萝卜快跑火了以后,其他城市快速跟进。7月8日,上海宣布,允许车内无安全员,最快一周内面向公众测试无人驾驶出租车。中央政府也明确支持,并且推动“车路云一体化”,作为国家的发展方向。北京市更是明文规定,今后新建、改建、扩建道路,都要在道路两侧为智能化基础设施预留空间。总之,无人驾驶已经不是实验室技术了,全国铺开测试、大规模应用,即将到来。

3、微软蓝屏事件

北京时间7月19日,美国网络安全公司CrowdStrike软件bug带崩了全球范围内的微软Windows系统,外媒将此称为“史上最大规模IT故障”。全球范围内,包括航空公司、医院、铁路网络和电视台在内的关键企业和服务都因微软系统中断而瘫痪,就连美国911电话的接线员都无法对紧急情况作出回应。此外,全球供应链也受打击,其中,高度复杂的航空系统受创最为严重,航空运输可能需要几周时间才能恢复正常。

三、技术文章

四、开源组件

1、OmniParse

Omniparse 是一个开源文件解析平台,可以将任何非结构化数据(文档、表格、图像、视频、音频文件或网页)解析成结构化、可操作的数据,并针对 LLM 应用程序进行优化。它支持多种文件类型,可以提取表格、图像、音频/视频转录、网页爬取等功能,并可以使用 Docker 轻松部署。

OmniParse

2、GraphRAG

微软开源的 GraphRAG 是一种基于图的检索增强生成方法。通过 LLM 构建知识图谱结合图机器学习,GraphRAG 极大增强 LLM 在处理私有数据时的性能,同时具备连点成线的跨大型数据集的复杂语义问题推理能力。普通 RAG 技术在私有数据,如企业的专有研究、商业文档表现非常差,而 GraphRAG 则基于前置的知识图谱、社区分层和语义总结以及图机器学习技术可以大幅度提供此类场景的性能。微软在其博客上介绍说,他们在大量数据集上进行了测试,在全面性、多样性、赋权性方面,结果显示 GraphRAG 都优于朴素 RAG(70~80% 获胜率)。

3、PDF-Extract-Kit

PDF-Extract-Kit 是一个专门用于提取PDF文件中高质量内容的工具包。它通过多个组件实现对PDF文档的深度解析,包括版面检测、公式检测、公式识别和光学字符识别。

PDF-Extract-Kit

4、crawlee-python

Crawlee 是一个网页抓取和浏览器自动化的 Python 库,可用来提取 AI、LLM、RAG 或 GPT 的数据。

五、工具软件

1、SunoAI(免费)

Suno AI是一款基于人工智能的音乐创作工具,它可以帮助用户轻松地创作出各种风格的音乐作品。通过使用先进的深度学习技术,Sono AI能够生成具有高质量音频输出和立体声效果的歌曲,效果非常惊艳。

SunoAI

2、EasyVideoTrans(开源)

一个开源工具,能够快速的将英文视频转成中文视频,部署需要GPU环境。

3、Win11Debloat(开源)

Win11Debloat是一个旨在通过删除 Windows 10 和 Windows 11 中不必要的系统组件、应用程序和服务来优化系统性能并提高用户体验的开源项目。

六、学习资源

1、LLM-Powered-RAG-System(英文)

一个收集性质的清单,列举了与RAG技术相关的框架、应用程序。

2、metahuman_overview(中文)

一个收集性质的清单,列举了与数字人有关的技术。目前数字人主要包括形象、声音和对话能力几方面,主要交互方式为直接与数字人进行对话。

七、生活经验

1、德雷克海峡

德雷克海峡(Drake Passage)位于南美洲与南极洲之间,太平洋和大西洋在这里交汇。南极大陆的干冷空气与美洲大陆湿暖的气流之间存在气压差,使得这里成为地球上最危险的海域,终年有八级以上大风,狂浪肆虐,无数水手丧生于此。海峡一侧就是南美洲最南端的合恩角,在这里耸立着一块纪念碑。上面写着,纪念在此处死于海难的至少 10,000 名水手。

德雷克海峡

2、卷烟销售与肺癌死亡率

下图有两根曲线,紫色是美国历年的卷烟销售数量,红色是肺癌死亡率。可以看到,两者形状一模一样,表明是强相关,肺癌死亡率滞后卷烟销售量大约25年~30年。1964年,美国卷烟销售达到顶峰,然后逐年下降;1990年代初,肺癌死亡率达到顶峰,然后逐年下降。

卷烟销售与肺癌死亡率

八、闲情逸趣

九、数字与言论

1、我们花费了地球上一半的工程努力,来为每个应用程序添加 AI 聊天机器人,而世界上一半的行业还没有弄清楚如何经常备份数据库。推出 AI 产品的公司数量,远远超过了实际用例的数量。——《如果你再提 AI,我就要发作了》

2、许多开发者不喜欢前端,主要有两个原因。一是前端太受流行风潮的影响,二是前端开发者主要由年轻的/新入行的/自学的人员组成,他们“不断发现”新范式。这使得前端技术极不稳定,你学不到真正长久的东西。——Hacker News

3、大学课程《计算机体系结构》,选择的 CPU 往往不是流行的架构,比如 x86 和 ARM,而是一些很原始、早被淘汰的 CPU。原因是这门课的目的是架构的思想,而不是细节,因此选择一个“原始” CPU 更有帮助。——StackExchange

Copyright © yoyo all right reserved,powered by Gitbook该文件修订时间: 2024-07-21 16:36:15

results matching ""

    No results matching ""