【发布时间】:2017-12-12 12:19:07
【问题描述】:
我遇到了以下问题,希望有人能给我一些建议。
我需要将很多不同形状的excel表格转换成构造数据,excel表格如下。
|--------------------|----|----|
|user:Sam | | |
|--------------------|----|----|
|mail:sam@example.com| | |
|-------|----------------|-----|
|user |Jack | |
|-------|----------------|-----|
|mail |jack@example.com| |
|-------|----------------|-----|
|-------|-----|---------------|---------|
|user |May | | |
|-------|-----|---------------|---------|
| |mail |may@example.com| |
|-------|-----|---------------|---------|
|user | Alex |mail |alex@example.com|
目标结果将类似于以下格式。
|-------|-------------------|
|user | email |
|-------|-------------------|
|Jack | jack@example.com |
|-------|-------------------|
|Sam | sam@example.com |
|-------|-------------------|
|Alex | alex@example.com |
|-------|-------------------|
|May | may@example.com |
|-------|-------------------|
我目前的解决方案是为每种类型的 excel 表定义一个函数。但是会有成千上万个不同的 excel 文件,所以我不得不重复编写类似的代码。所以我的问题是是否有通用的解决方案。
我找到了一个similar question,但没有更多信息。我认为机器学习可能有助于解决问题,但我对此知之甚少。有没有人可以分享一些想法? 非常感谢!
【问题讨论】:
标签: python excel machine-learning