浅谈PHP大数据处理

发表于2015-04-27|更新于2016-05-31|PHP

|浏览量:

新换的公司，一个表中的数据竟然有29G之大，我顿时就懵了，更让我惊讶的是，还与另一个1G多的表做关联查询，真是让我摸不着头脑，尤其这是mysql数据库，也是惊出了我一身冷汗，好在还有优化的解决方案，下面简单谈一下我的解决方案。

尽量不要用inner join，内连接查询速度慢，建议为left jion。
建立索引，两个表中关联的字段都要加上key，可以为主键索引，唯一索引，普通索引等。
limit 分段处理，每次取2000条，处理完之后再取数据处理。
mysql数据库优化，将InnoDB的类型改为MyISAM,MyISAM数据引擎更适合大数据的搜索查询。
优化数据库，使用存储过程式查询，存储过程优势是查询一次后再次查询会很快。
利用Explain获取的信息来实现mysql优化，参考地址：http://www.cnblogs.com/promise-7/archive/2012/05/25/2517356.html

其实归根结底是数据库方面的优化，当然数据量很大的情况下，要提前预知好，更换数据库是避免查询宕机的关键，如果提前预知用oracle数据库的话，就不会出现现在的情况，现在改数据库，花费的代价很大。

文章作者: Dragon_SZ

文章链接: https://blog.xiaoshenlong.cc/2015/04/27/30/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Dragon_SZ！

相关推荐

NodeJs连接数据库

NodeJs链接数据库的问题，这里涉及到node的版本的问题,所以这里就说一下新旧版本链接数据库的方法问题。首先，无论新旧版本，都得安装mysql驱动，类似与jdbc驱动的东西。 linux下安装方法：安装mysql 插件 1npm install mysql安装成功后的位置：C:\Users\用户名\node_modules\mysql//此为windows下的安装路径，自己可以任意设置，不过要记住安装路径/opt/mysql/node_modules/mysql //此为linux下的安装路径查看readme.md文件的方法http://daringfireball.net/projects/markdown/dingus 其次，编写一个小例子进行测试。 //此为较低版本的的数据库链接方式 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950...

EJB 是运行在独立服务器上的组件，客户端是通过网络对EJB 对象进行调用的。在Java中，能够实现远程对象调用的技术是RMI，而EJB 技术基础正是RMI。通过RMI 技术，J2EE将EJB 组件创建为远程对象，客户端就可以通过网络调用EJB 对象了。 a.EJB实现原理：就是把原来放到客户端实现的代码放到服务器端，并依靠RMI进行通信。 b.RMI实现原理：就是通过Java对象可序列化机制实现分布计算。 c.服务器集群：就是通过RMI的通信，连接不同功能模块的服务器，以实现一个完整的功能。参考博客：[http://blog.csdn.net/jojo52013145/article/details/5783677](http://blog.csdn.net/jojo52013145/article/details/5783677 "EJB到底是什么")

Session Error(DWR)

DWR的Session Error问题，前台页面跳出session error的对话框而控制台则输出:2014-2-23 11:58:53 org.directwebremoting.util.CommonsLoggingOutput error。严重: A request has been denied as a potential CSRF attack的错误信息.请求被拒绝因为可能存在csrf(cross-site request forgeries,跨站请求伪造)攻击.也就是说页面URL可能被跨站了的服务所调用。在web.xml配置文件中dwr的配置加入corssDomainSessionSecurity这个配置选项，这个参数是在dwr版本2.0才有的.默认值为true,也就是禁止其他域发送请求。 corssDomainSessionSecurity:设置成false能够从其他域进行请求.注意这样做会在安全性上有一些冒险。参考网址：[http://my.oschina.net/u/566829/blog/81935](http://my.oschina.net/u/...

卸载 Oracle11g

完全卸载oracle11g步骤:1、开始－＞设置－＞控制面板－＞管理工具－＞服务停止所有Oracle服务。2、开始－＞程序－＞Oracle - OraHome81－＞Oracle Installation Products－＞ Universal Installer，单击“卸载产品”-“全部展开”，选中除“OraDb11g_home1”外的全部目录，删除。5、运行regedit，选择HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE，按del键删除这个入口。6、运行regedit，选择HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services，滚动这个列表，删除所有Oracle入口(以oracle或OraWeb开头的键)。7、运行refedit，HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application，删除所有Oracle入口。8、删除HKEY_CLASSES_ROOT目录下所有以Ora、Oracle、Orcl或E...

Webservice与Servlet的区别

Servlet是Java对于Web开发而产生的一项技术，可以说Servlet技术是Java专有的，它是服务器端的技术，客户端通常是浏览器，而WebService是在DCOM CORBA等分布式技术之后发展起来的。WebService有一个国际通用的标准SOAP。具体规范发布在[http://www.w3.org/TR/SOAP/](http://www.w3.org/TR/SOAP/ "http://www.w3.org/TR/SOAP/") SOAP是为了在Internet 环境下，实现系统是松散耦合的、跨平台的，与语言无关的，与特定接口无关的，而且要提供对Web 应用程序的可靠访问。几乎所有的开发工具都可以开发WebService系统，包括Java,C#,甚至基于VCL架构的Delphi。而且所开发出来的WebService系统，可以方便的被各种客户端调用，包括，浏览器，W32应用程序，还有Java App。可以这么说，开发一个WebService系统，把它放到互联网上，生成一个WebService描述...

Mongodb的基本操作

#存储嵌套的对象 1db.mydb.save({'name':'ysz','address':{'city':'beijing','post':100096},'phone':[138,139]}) #存储数组对象 1db.mydb.save({'Uid':'yushunzhi@sohu.com','Al':['test-1@sohu.com','test-2@sohu.com']}) #根据query条件修改，如果不存在则插入，允许修改多条记录 1db.mydb.update({'yy':5},{'$set':{'xx':2}},upsert=true,mul...