原文towardsdatascience.com/roll-up-your-sleeves-9-data-and-machine-learning-project-walkthroughs-you-should-explore-9020402249ac?sourcecollection_archive---------5-----------------------#2024-05-23https://towardsdatascience.medium.com/?sourcepost_page---byline--9020402249ac--------------------------------https://towardsdatascience.com/?sourcepost_page---byline--9020402249ac-------------------------------- TDS 编辑·发表于 Towards Data Science ·以 通讯 形式发布 ·3 分钟阅读·2024 年 5 月 23 日–感觉受到启发想写下你第一篇 TDS 文章吗我们始终欢迎新作者的投稿。欢迎来到《Variable》的一期特别、实践导向、项目聚焦版我们知道现如今对数据和机器学习专业人士来说实践技能是多么重要。在竞争激烈的求职市场中展示你解决复杂现实问题的能力、有效使用前沿工具的能力以及从最混乱的数据集中提取有意义的洞察力具有额外的价值。为了帮助你扩展工具箱并激励你学习新主题、尝试新工作流程我们收集了一些我们近期最有趣的教程。它们聚焦于项目执行的细节很多教程还附带了大量代码片段供你在自己的环境中进行实验。让我们开始吧探索大型语言模型在 ICD 编码中的应用——第一部分在机器学习与医疗管理的交汇处Anand Subramanian展示了利用大型语言模型简化临床编码这一关键过程的潜力。如何构建用于节点分类的神经网络在她的最新文章中Claudia Ng提供了一个全面的指南教你如何从一个 CSV 文件和 PyTorch Geometric 开始构建基于图形的神经网络。从数据到仪表板使用 Dash Leaflet 和 SeaRoute 库可视化古代海上丝绸之路对于所有地理空间数据爱好者Maria Mouschoutzi 博士的首篇 TDS 文章解释了如何解决可视化海上航线的挑战。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/ef9407f31b724bcbc21ffe897736a373.png图片由Tanner Mardis提供来源于Unsplash使用 LangChain、Chainlit 和 Literal AI 构建可观察的 arXiv RAG 聊天机器人在详细的 RAG 项目演示中Tahreem Rasul带我们一步步了解如何通过整合一系列强大的工具来创建一个语义化的科研论文引擎。使用 LLM 从 YouTube 学习从不同的角度接近检索增强生成Alok Suresh的指南探索了如何从视频中提取信息并将其用于更高效的问答聊天机器人。**通过 Python 包 Yellowbrick 和 PiML 解锁有价值的数据和模型见解附代码**想动手试试 Python 吗Dr. Theophano Mitsa分享了一个易于理解的介绍教你如何使用 Yellowbrick 和 PiML 包并展示如何利用它们更好地理解模型行为。从零开始构建蛋白质的 Transformer 模型计算生物学是受益于人工智能最近进展的领域之一。举个例子Yuan Tian在构建基础蛋白质 Transformer 模型预测抗体序列的抗原特异性方面的迷人工作。用小狗特征网页应用程序探索 Shiny for PythonShiny for Python 将原本专注于 R 的库引入了更广泛的数据科学家群体。Deepsha Menghani的逐步教程将帮助你充分发挥其应用构建的优势。从零开始重建 PyTorch带 GPU 支持和自动微分**“**在这些操作过程中内部发生了什么这一切是如何工作的”这些是Lucas de Lima Nogueira在使用 PyTorch 时自问的问题——因此他尝试自己重建这个库。准备好挽起袖子思考更多理论性问题了吗我们已经为你准备好了。Sydney Nye的新图论指南是一个全面的学习资源涵盖了图论的历史、基础数学以及潜在应用。如何通过物理原理为我们的数据提供更深的洞察空间Tim Lou 博士发人深省的文章指出了令人着迷的跨学科联系。“是更好地设计一个特征来包含尽可能多的关于代码系统的信息还是找到一种方法让模型来完成这项工作”Valerie Carey在探讨层次分类的替代编码方法时提出了这个问题。Jarom Hulet通过一个引人入胜、灵感来源于钓鱼的例子提供了关于多臂强盗问题的详细解释以及如何解决这些问题。为了完善你本周的阅读推荐我们推荐Elliott Stam的关于数据投资回报率的深思熟虑的反思这是一本为团队和经理提供的有用入门指南帮助他们避免导致负回报的做法。感谢你支持我们作者的工作我们热衷于发布新作者的文章因此如果你最近写了一篇有趣的项目演练、教程或是关于我们核心话题的理论反思别犹豫赶紧与我们分享。直到下次 VariableTDS 团队