【发布时间】:2020-04-11 04:47:03
【问题描述】:
这个问题主要与 Alteryx 相关,但是如果它可以在 Python 中完成,或者使用 R 工具在 Alteryx 工作流程中的 R 中完成,那么它也可以。
我有两个数据集。
地址(包含地址信息:Line1、Line2、City、State、Zip)
USPS(包含 USPS 缩写:Street to ST、Boulevard 到 BLVD 等)
目标:查看 Line1 的地址数据集上的字符串。如果它包含 USPS 数据集中的一种街道类型,我想用 USPS 数据集中不同列中的正确缩写替换字符串的那部分。
例如,123 Main Street 将变为 123 Main St
我尝试过的: 导入了两个数据集。 使用当字段不同时输出所有字段的指令将两个数据集合并。 添加了一个公式,但这是我卡住的地方。到目前为止,它的内容是:
if [Addr1] Contains(Sting, Target)
不确定如何在 USPS 中查找其中一个值。我也不确定是否可以进行这种动态查找。
如果这可以在 python 中完成(我知道非常基本的 Python,所以我还没有代码,因为除了导入数据我不知道从哪里开始)我可以在 Alteryx 中使用 python。
任何帮助都会很棒。如果您需要更多信息,请告诉我。
提前谢谢你。
【问题讨论】: