高性能不停机 T+0 的实现

【摘要】
定期将大数据导出到历史库以减轻生产库的压力,再基于分库计算技术,不难实现高性能的 T+0 查询报表。但如何导出却是个问题。
冷导出相对容易,但导出过程中必须停止服务。若要保证提供不间断服务,就需要合理的热导出机制:如何保证导出过程中的正确查询,避免还没来得及追加的数据被漏查?
如果使用文件作为历史库,虽然可以提高查询性能,但由于缺乏事物一致性,历史数据导出时正在改写的文件还不可用,又如何确保多并发下不间断地提供正常的查询服务?

PDF 下载