分类: 数据工程

文章分类
数据工程 8 后端架构 7 MLOps 3 分布式架构 3 云原生 1 分布式系统 3 全栈架构 2 DevOps 1 数据工程与存储 1 安全架构 1
                            
                            利用 Apache Spark 与 Git LFS 构建基于 SQLite 的原子化 CI 结果数据管道
                        
                                我们的 monorepo CI 系统正在变成一个性能黑洞。一个看似无害的 PR 能触发数百个独立的构建和测试任务，而定位其中引入的性能衰退，完全依赖工程师的人工排查和直觉。日志散落在各处，缺乏结构，更不用说进行趋势分析了。我们需要一个系统，
                            
                                2023-11-15
                            
                                    数据工程
                                
                            Apache Spark
                        
                            SQLite
                        
                            Git
                        
                            Turbopack
                        
                            ACID
                        
                            构建支持 PyTorch 在线推理的低延迟实时特征存储架构
                        
                                当推荐系统或风控模型的在线推理（Online Inference）请求 QPS 从一万攀升到十万时，最大的瓶颈往往不再是模型计算本身，而是实时特征的获取延迟。批处理生成的特征时效性太差，无法捕捉用户最新的意图；而一个为在线服务设计的、能够支
                            
                                2023-10-27
                            
                                    数据工程
                                
                            Cassandra
                        
                            Google Cloud Pub/Sub
                        
                            Flask
                        
                            SSR
                        
                            PyTorch
                        
                            使用Puppet自动化部署由Weaviate、Apache Iceberg与MariaDB构成的混合特征存储架构
                        
                                我们的机器学习平台最初陷入了一片混乱。特征工程管道的每个组件——离线批处理、在线实时查询、向量相似性检索——都由不同团队手动部署和维护。环境漂移成了家常便饭，开发环境的一个“小”配置更新，在生产环境就可能引发雪崩式的故障。问题的根源在于我们
                            
                                2023-10-27
                            
                                    数据工程
                                
                            Puppet
                        
                            Weaviate
                        
                            Apache Iceberg
                        
                            MariaDB
                        
                            MLOps
                        
                            IaC
                        
                            构建从PostgreSQL到Elasticsearch的准实时、最终一致性同步管道
                        
                                我们面临一个在分布式系统中极为常见但又充满挑战的问题：如何维持一个事务型数据库（PostgreSQL）和一个搜索系统（Elasticsearch）之间的数据一致性。业务要求对数据的查询维度非常复杂，单纯依赖PostgreSQL的索引难以满足
                            
                                2023-10-27
                            
                                    数据工程
                                
                            消息队列
                        
                            搜索
                        
                            分布式一致性
                        
                            CDC
                        
                            Debezium
                        
                            构建金融风控实时特征平台中利用分布式锁保证 Spark 计算一致性的架构权衡
                        
                                在金融风控场景下，特征计算平台的稳定性和数据一致性是整个系统的基石。我们面临的核心挑战是：如何在一个分布式的环境中，调度数百个 Apache Spark 作业，对海量的用户数据进行周期性、分片区的特征计算，同时确保任何一个计算单元（例如，某
                            
                                2023-10-27
                            
                                    数据工程
                                
                            Apache Spark
                        
                            分布式锁
                        
                            GraphQL
                        
                            Apollo Client
                        
                            金融风控
                        
                            基于 Apache Flink 与 Clean Architecture 构建流式驱动的静态站点生成管道
                        
                                一个棘手的需求摆在面前：为高吞吐量的用户行为日志（每秒数万次页面浏览）构建一个近实时的监控仪表盘。传统方案，如使用ELK或直连时序数据库的前端轮询，因其高昂的实时查询成本和复杂的后端维护而被否决。我们的目标是极致的性能、低廉的成本和最小的运
                            
                                2023-10-27
                            
                                    数据工程
                                
                            Apache Flink
                        
                            Clean Architecture
                        
                            AWS
                        
                            SSG