本文最后更新于 197 天前,其中的信息可能已经有所发展或是发生改变。
应用自定义包比较寻找数据区间并合并两组数据:
示例:将两张表按照data1中的shop_time及data2中的开始与结束时间合并。
数据1:data1 为订单表
数据2:data2 促销活动表
代码如下:
pip install kedaofx
from kedaofx import data_manage
data_manage.contrast_merge(data1,"shop_time",data2,"promo_start_date","promo_end_date","promo_id")
# contrast_merge(data1, data1_name, data2, data2_sta_name, data2_end_name, data2_key_name, how="left"):
"""
:param data1: 需要比较的数据源
:param data1_name: 需要比较的列名称
:param data2: 比较数据源
:param data2_sta_name: 比较区间开始列的名称
:param data2_end_name: 比较区间结束列的名称
:param data2_key_name: data2 的主键
:param how: 表链接方式 how有5个参数left,right,outer,inner,cross,具体参考marge中的how参数
:return: 返回一个两张表链接的DateFrame
注:涉及的名称需要字符串格式
实例:
st_en(data1=data_order, data1_name="shop_time", data2=data_promo, data2_sta_name="promo_start_date",
data2_end_name="promo_end_date",data2_pr_key="promo_id")
"""
输出如下: