
项目场景是给做用户年报,项目属于活动类型,需要维持1个月左右,需要统计用户操作的一些数据,主要是统计方面的,当时注册用户大概280w左右,
腾讯云 2023-02-26 11:10:59
项目场景是给做用户年报,项目属于活动类型,需要维持1个月左右,需要统计用户操作的一些数据,主要是统计方面的,当时注册用户大概280w左右,书单、评论、打赏还可以,之前的数据做过分表,只有阅读记录log大概将近1亿条,是个大难点。
【资料图】
一次性取出1000条数据,还是一次处理100? 答案是取1000条,如果服务器的内存允许,一次可以取更多条,应该尽量避免mysql进程中连接和断开的消耗,性能提高的非常明显,17w测试数据,从8条/秒 提升到 140条/秒!
把数据量偏小的取出,做map映射,以提高最大的性能,再使用的地方用key拼接使用。
Array( [67] => 还阳 [69] => 做媒 [70] => 共业招感 [71] => 流心彩虹糖 [72] => 雪中燃灯 [73] => 王座 [74] => 不言而喻 [75] => 王以君倾 [76] => 踏雪寻泥 [77] => 有匪君子)
SELECT `user_id` ,`novel_id` ,`chapter_id` ,MIN(DATETIME) AS `datetime`FROM `wm_novel_reward`WHERE `user_id` BETWEEN 1AND 1006GROUP BY user_id`
出于对安全的考虑,当mysql是字符串的时候,需要对字符串进行转义,保证sql语句的正常操作。
#面向对象风格mysqli::real_escape_string ( string $escapestr ) : string#过程化风格mysqli_real_escape_string ( mysqli $link , string $escapestr ) : string
对于操作频次较高的业务场景中,分表的情况比较多,使用UNION ALL进行优化处理。
$commentMostSqlArr = [];for ($i = 0; $i < 128; $i ++) { $table = "cp_comment_msg_uid_".$i; $commentMostSqlArr[] = "SELECT `uid`,`nid` ,`module_name` ,`aid` , `author_name` ,count(module_id) AS count_comment_number FROM {$table} Where `uid` BETWEEN {$minUid} AND {$maxUid} AND `gift_id` = 0 AND `create_time` > {$total_start_time} AND `create_time` <= {$total_end_time} Group by nid, uid ";}$commentMostSql = "SELECT * FROM (" . implode(" UNION ALL ", $commentMostSqlArr) . ") t";
1.数据重复有两个方面,一个是PHP数组数据的重复,一个是Insert
语句重复,这样解决的:
PHP数据重复使用array_unique( $array )
,注意键名保留不变,array_unique() 先将值作为字符串排序,然后对每个值只保留第一个遇到的键名,接着忽略所有后面的键名。这并不意味着在未排序的 array 中同一个值的第一个出现的键名会被保留。
2.mysql层面使用sql语句去重,使用 INSERT IGNORE INTO
去重:
INSERT IGNORE INTO 与 INSERT INTO 的区别就是 INSERT IGNORE INTO 会忽略数据库中已经存在的数据,如果数据库没有数据,就插入新的数据,如果有数据的话就跳过这条数据。这样就可以保留数据库中已经存在数据,达到在间隙中插入数据的目的。
以下实例使用了 INSERT IGNORE INTO,执行后不会出错,也不会向数据表中插入重复数据,而 REPLACE INTO 如果存在 primary 或 unique相同的记录,则先删除掉。再插入新记录,再性能上会慢一些。
INSERT IGNORE INTO person_tbl (last_name, first_name) VALUES( "Jay", "Thomas");
INSERT INTO
可以拼接一次插入数据库,比单条插入的性能要快很多,尤其是多条的时候,也有一个小缺点,当其中一个字段有问题时整条语句一起失败。
INSERT INTO `annual_report_2020`(`user_id` ,`user_regtime` ,)VALUES ( 2 ,1500341346 ) , ( 5 ,1502195321 ) , ( 6 ,1502242604 )
1.memory_limit设置脚本内存
memory_limit
的值是越大越好么?当然不是,memory_limit
主要是为了防止程序 bug, 或者死循环占用大量的内存,导致系统宕机。在引入大量三方插件,或者代码时,进行内存限制就非常有必要了。
memory_limit
会使每个 PHP process 都占用固定的内存?memory_limit 只是限制了每个 PHP进程的内存占用上限,而不是为每个进程分配了固定的内存。所以,并不会因为 memory_limit 设置越大,导致并发数出现降低。
2.set_time_limit设置脚本执行时间
在php中set_time_limit函数是用来限制页面执行时间的,如我想把一个php页面的执行时间定义为5秒
就可以set_time_limit(5)了,规定从该句运行时起程序必须在指定秒数内行结束,0代表不限制。
set_time_limit(0);ini_set("memory_limit", "1024M");
很多时候我们都在说内存,其实内存的概念很笼统,内存分为CPU上的缓存(catch)和内存条上的内存(Memory),平时说的服务器8G内存指的是内存条上的内存。Cpu已经从Lmp总线型,升级成NUMP的方式,Nginx就是利用NUMP很好的例子。
其实有一个问题特别迷惑,Mysql数据库里的数据就是以特殊结构存储(B-tree)的文件,Redis中的数据也是用(list、hash)结构存储的数据,存储上没有什么太大的不同,只是有快慢的区别。
而高性能就是尽最大的程度上利用Cpu和内存,提高吞吐量,词很贴切。
后来在正式环境执行的时候,我们还是遇到了别的问题,等我有时间再整理,不要打断这一篇博客主题,我们下一篇见,谢谢您的阅读。
项目场景是给做用户年报,项目属于活动类型,需要维持1个月左右,需要统计用户操作的一些数据,主要是统计方面的,当时注册用户大概280w左右,
1、老挝签证共分为过境签证、旅游签证、劳务签证、探亲访友和商务签证。2、旅游签证即到老挝旅游的外国人,必须向老挝大使馆申
本文转自【风情三江】;关于柳州市三江侗族自治县八江镇布央村购物长廊发生火情的情况通报2月25日,柳州市三江侗族自治县八江
1、怀庆府:〔冲,繁。2、隶河北道。3、河北镇总兵、黄沁同知驻。4、〕清初沿明制,领县六。5、后割开封之原武、阳武来隶。
1、《中国当代摄影图录,于涛》是2021年浙江摄影出版社出版的图书,作者是刘铮。2、。文章到此就分享结束,希望对大家
01:57初春时节,全国人大代表、河北省沧州市河间市大庄村党支部书记石炳启深入乡村,走进田间地头,倾听群众呼声,就乡村人
谁都不知道明天和意外哪个会先到来。据网友不完全统计,在2月22日到23日的24h内,竟然有3位网红名人相继去世,其中一位更是当初陈冠希、张柏芝
1、《凤凰令》是由360发行的一款叛逆武侠双端网游,游戏采用ELF精灵引擎,支持客户端及web双端模式。2、堪比史诗级电
广袤的宇宙中,地球只是一个暗淡蓝点,它似乎无足轻重。但在这个宇宙中,还有一种神秘的存在,被称作“宇宙观察者”,他们看似是一群超越时间
1、《中西医结合执业医师资格考试冲刺试卷》是一本图书。2、作者是马维骐。文章到此就分享结束,希望对大家有所帮助。
1、哺乳期可以吃点阿胶,但产后不宜过早食用,容易导致恶露排出不畅。2、恶露消除后,可以适量食用,因为阿胶是很好的补血佳品
2月24日,广东全省推动产业有序转移促进区域协调发展工作会议在广州召开,会上对《关于推动产业有序转移促进区域协调发展的若
1、爱新觉罗·胤禩(禩同祀,为祀异体字;1681年-1726年),清朝宗室,清圣祖康熙帝第八子,雍正异母弟,生母良妃卫氏
1、这个问题太。2、教你吧赚2分选上你要复制的东西Ctrl+C然后再按Ctrl+Vctrl+c复制ctrl+v粘贴
1、习语起源:宋《云笈七签元气论》:“两仪若分三才,身土治天,负阴抱阳;瓜熟了,就同时舔。”2、本义:瓜熟了,蒂自然脱落。3、引申含义: