【发布时间】:2021-12-23 10:18:13
【问题描述】:
我正在使用 Flink SQL,下面的方案显示了我的源数据(属于一些 Twitter 数据):
CREATE TABLE `twitter_raw` (
`entities` ROW(
`hashtags` ROW(
`text` STRING,
`indices` INT ARRAY
) ARRAY,
`urls` ROW(
`indices` INT ARRAY,
`url` STRING,
`display_url` STRING,
`expanded_url` STRING
) ARRAY,
`user_mentions` ROW(
`screen_name` STRING,
`name` STRING,
`id` BIGINT
) ARRAY
)
)
WITH (...);
我只想获取集合中的主题标签。因此,我必须将构造对象(ROW)的集合映射到字符串数组。
喜欢这个方案:
CREATE TABLE `twitter_raw` (
`entities` ROW(
`hashtags` STRING ARRAY,
`urls` STRING ARRAY,
`user_mentions` STRING ARRAY
)
)
WITH (...);
我如何使用 Flink-SQL 实现这一点?也许是内置函数(JSON 函数?)或自己的 UDF,还是我必须编写一个 DataStream 作业?
提前致谢。
【问题讨论】: