相同文件按优先级取唯一值

张

张建站

2026/4/9 21:06:10

10分钟阅读

问题我有三个文件字段名都一样如果不重复就union到一起如果有重复按类型优先级取唯一值用python实现import pandas as pd from datetime import date import time todaystr(date.today()) filepath/Users/kangyongqing/Documents/kangyq/202207/课消管理看板/2023Q3课消/亚欧课消11月/课消定标方案新版/202604课消定标/ file1/Users/kangyongqing/Documents/kangyq/202207/课消管理看板/2023Q3课消/亚欧课消11月/课消定标方案新版/202604课消定标/课消定标方案新版2026-03-25.xlsx file2/Users/kangyongqing/Documents/kangyq/202207/课消管理看板/2023Q3课消/亚欧课消11月/课消定标方案新版/202604课消定标/4月基地定标/课消定标方案新版-基地2026-03-30.xlsx file3/Users/kangyongqing/Documents/kangyq/202207/课消管理看板/2023Q3课消/亚欧课消11月/课消定标方案新版/202604课消定标/4月新兼职定标/课消定标方案新版-新兼职2026-03-30.xlsx df1pd.read_excel(file1,usecols[student_user_id, real_name, age,最终标值]) df1[type]大盘 print(df1.head(2)) df2pd.read_excel(file2,usecols[student_user_id, real_name, age,最终标值]) df2[type]基地 print(df2.head(2)) df3pd.read_excel(file3,usecols[student_user_id, real_name, age,最终标值]) df3[type]新兼职 print(df3.head(2)) df_allpd.concat([df1,df2,df3],ignore_indexTrue) print(df_all.head()) # 定义优先级映射数字越小优先级越高 priority_map { 基地: 1, 新兼职: 2, 大盘: 3 } # 定义去重函数按优先级取唯一值 def dedup_by_priority(df, key_colstudent_user_id, priority_coltype): # 添加优先级数值列 df[priority_num] df[priority_col].map(priority_map) # 按 key_col 分组取 priority_num 最小的行 df_dedup df.loc[df.groupby(key_col)[priority_num].idxmin()] # 删除临时列 df_dedup df_dedup.drop(columns[priority_num]) return df_dedup # 执行去重 result dedup_by_priority(df_all, key_colstudent_user_id, priority_coltype) result[student_user_id]result[student_user_id].astype(int64).astype(str) # 输出结果 result.to_excel(filepathf课消定标方案dm库上传取唯一值{today}.xlsx, indexFalse) print(去重合并完成)结果展示

Pebblebee Halo：追踪标签与个人安全的创新融合

兼具追踪与安全的多功能神器Pebblebee Halo 作为 Safe Haven 系列的首款产品，将追踪与个人安全功能完美融合。它不仅是一个传统的追踪标签，兼容 Apple 的 Find My 和 Google 的 Find Hub，能在地图上显示位置，蓝牙追踪范围在理想条…...

2026/4/9 20:58:32 阅读更多 →

紧急！GraalVM上线后OOM频发？立即执行这5个内存安全检查项——覆盖Quarkus/Spring Native主流框架

第一章：GraalVM静态镜像内存异常的典型表征与根因定位全景图GraalVM 静态镜像（Native Image）在启动性能与资源占用方面具备显著优势，但其编译期内存模型与运行时行为存在根本性差异，导致内存异常表现隐晦且难以复现。典…...

2026/4/9 20:58:28 阅读更多 →

小白程序员必看：收藏这份大模型学习指南（Agent/MCP全解析）

引言 – 随着生成式人工智能的兴起，“智能体（Intelligent Agent）”、“Agent”以及“Model Context Protocol (MCP)”这些名词频频出现。但它们之间的边界往往模糊：有人把 Agent 当作“智能体”，有人又提到 MCP 协议&a…...

2026/4/9 20:56:36 阅读更多 →

ESP32硬件PWM控制库PWMOutESP32实战指南

1. PWMOutESP32 库深度解析：面向嵌入式工程师的 ESP32 PWM 控制实践指南 1.1 库定位与工程价值 PWMOutESP32 是一个专为 ESP32 系列微控制器设计的轻量级 PWM 输出控制库，其核心目标是提供 Arduino 风格的 pwm.analogWrite(pin, value) 接口&#xff…...

2026/4/8 18:53:09 阅读更多 →

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

1. LongerWatchDog 库概述：突破AVR看门狗定时器的固有约束在嵌入式系统开发中，看门狗定时器（Watchdog Timer, WDT）是保障系统可靠性的关键机制。传统Arduino平台（尤其是基于ATmega328P、ATmega2560等AVR架构的板卡&…...

2026/4/9 14:50:52 阅读更多 →

LeetCode 92. Reverse Linked List II 题解

LeetCode 92. Reverse Linked List II 题解题目描述给你单链表的头指针 head 和两个整数 left 和 right ，其中 left < right 。请你反转从位置 left 到位置 right 的链表节点，返回反转后的链表。示例 1： 输入：head [1,2,…...

2026/4/9 8:37:26 阅读更多 →