侧边栏壁纸
  • 累计撰写 56 篇文章
  • 累计阅读 12.4万

个人简历

WD1016
2026-04-09 / 109 阅读 / 正在检测是否收录...

10年研发经验(3年后端 + 7年大数据),具备从0到1数据架构建设及存量链路重构升级的实战经验,支撑内容推荐、用户画像、搜索、版权保护、金融等复杂业务场景,保障PB级数据规模的稳定高效运行。

1.数据架构:具备实时与离线数据链路建设及数据仓库建模经验,擅长成本与资源治理。

2.湖仓一体:具备数据湖与流批一体架构的生产落地经验,熟悉湖仓链路优化与稳定性保障。

3.云平台经验:深度参与多家云厂商大数据平台基准测试与生产级压测,有平台选型与迁移经验。

4.开源贡献:Apache Hudi 源码贡献者,优化 Flink 聚类策略 PR #14087(已合并)。

1.大数据计算与存储引擎

计算框架:Flink、Spark;资源与存储:HDFS、Yarn;查询分析引擎:Hive、Trino/Presto、Doris、ClickHouse;湖仓一体:Paimon、Hudi、Iceberg;元数据/加速:Kyuubi、Kylin。

2.数据集成与同步工具

CDC与实时同步:Flink CDC、Canal、Maxwell;批量/离线同步:DataX、Sqoop。

3.大数据平台与AI平台

工作流调度:DolphinScheduler、Azkaban;Flink管理平台:Dinky、StreamPark;可视化:Superset;云大数据平台:WeData(腾讯云)、DataWorks(阿里云)、华为云;AI应用平台:Dify。

4.后端开发框架与中间件

开发语言:Java、Python;微服务框架:Spring Boot、Spring Cloud;服务治理与配置:Nacos、ZooKeeper、Eureka;可观测性:SkyWalking;容器化:Docker、K8S;消息中间件:Kafka、RocketMQ;缓存:Redis、Pika。

27

评论

博主关闭了所有页面的评论