mysql分布式数据库

1.Mysql变成分布式数据库

数据仓库就是数据库,只不过是按照业界不同的提法说法不同而已; 一般的数据仓库的说法是要建立一个高性能的可查询数据库,一般说来是提供高效的查询而不是交互。

从软件出发考虑:

mysql现有的几种数据库从5.5后缺省的数据引擎是innodb, 性能在查询上和myisam差不多,不过对事物的支持更加好。 如果需要建立一个有规模的数据仓库首先必须考虑查询和聚合运算的效率问题, 从mysql内部的函数的使用效率出发选用innodb可以支持复杂的存储过程让运算集中在服务器上运行,可以高效的发挥服务器的运算性能和sql集合运算的效率。

从平台考虑:

数据仓库的数据源可能来自不同的操作系统和数据库, 怎么把数据同步到本地可以参考通用的方法,作为数据仓库需要考虑的是数据的一致性,比如一个流程的不同环节的数据来自不同的数据库,这时就需要考虑怎么来定制来保证数据的时效和一致,比如不允许第一步的数据还未进行同步,第二步的数据就已经同步到本地,这样的话后台的应用在读取数据的时候就会非常的混乱

从硬件出发考虑:

数据仓库一般是从业务数据库导出到另外一个独立数据库作为计算分析, 这样的好处在于把计算分开,避免非业务的大规模运算对正常业务的影响。即使软硬件崩溃也不会对正常业务造成影响,而数据重建只需要按照原来的方法恢复即可。在往数据仓库上同步数据的过程要灵活考虑数据同步的方法,缺省可直接使用mysql的主从备份。 如果不想对业务服务器造成太多影响,也可以采用自己定制的方法来进行增量备份和差异备份。

从sql的使用出发考虑:

能够交由sql完成的工作最好全部使用sql来完成聚合,表和表进行联合的时候先进行添加约束,和外部的程序,比如统计分析的计算,尽量让sql输出一个计算后的数据集给后台应用。

mysql分布式数据库  第1张

2.分布式数据库是做什么的?

随着2113互联网的飞速发展,人类社会的数据量迅5261速激增,据统计4102目前人类一年产生的数据就相1653当于人类进入现代化以前所有历史的总和,而且互联网业务的发展通常具有爆发性,业务量很可能在短短的一个月内突然爆发式地增长几千倍,对应的数据也很可能快速地从原来的几百GB飞速上涨到了几百个TB。如果在这爆发的关键时刻,系统不稳定或无法访问,那么对于业务将会是毁灭性的打击。

这时,传统的单机数据库提供的服务,在系统可扩展性、性价比方面已不再适用。伴随着对于系统性能、成本以及扩展性的新需求,分布式数据库系统应运而生,力求突破单机MySQL容量和性能瓶颈,彻底消除单机数据库无法支撑企业业务高速发展的后顾之忧。

以万里开源GreatDB分布式数据库产品为例,为大家详细解析分布式数据库的一些重要特性和技术实践细节。

水平拆分:支持数据sharding,分布式部署;

动态扩展:支持动态扩容,数据在线重分布;

故障恢复:故障自动切换保证系统高可用性;

分布式事务:提供ACID分布式事务支持;

数据安全:提供企业级数据安全特性,例如密码复杂度,访问控制;

MySQL协议:完美适配mysql,继承mysql生态;

并行计算:基于数据分布式部署制定分布式执行计划,通过分布式并行实现高性能;

读写分离:提供基于数据冗余的读写分离,实现读扩展;

HTAP融合:实现基于内存计算的TP与AP混合负载支撑;

云化支持:提供OpenStack、容器、物理机等DBaaS支持;

国产硬件支持:支持国产软硬件龙芯、飞腾、鲲鹏,中标麒麟芯片、银河麒麟、拓林思操作系统;

mysql分布式数据库  第2张

3.为什么现在大部分互联网公司使用的数据库是MySQL?

很简单的问题,我只是杀个鸡,想吃顿好的,可以选的工具有匕首,菜刀,小砍刀,大砍刀,自动化宰杀机,你会选哪个?[抠鼻][抠鼻]

mysql分布式数据库  第3张

4.为什么现在大部分互联网公司使用的数据库是MySQL?

Mysql比较简单,是个程序员就能管理他,做些性能优化什么的。Oracle养个DBA一年就得几十万。Oracle的优点是在数据完整性和分布式上,小型企业用不上。

mysql分布式数据库  第4张

上一篇:爬虫软件刷奖
下一篇:公司建网站要多少费用