vpsee.com » lamp

[hi@vpsee.com]$ su root -

Craigslist 的 LAMP 架构

2009年09月14日 | 标签: architecture, lamp

关于 Craigslist 的介绍以及一些访问量多大、负载多强大的数据就省略了，VPSee 关心的是背后的技术架构，主要参考文章：MySQL and Sphinx at Craigslist 和 Database War Stories #5: craigslist.

架构

硬件环境： Supermicro 4U 7043-P8、Dual Intel Xeon 3.2 512KB CPU、16GB 内存、16个硬盘组成的 Raid 10；
软件系统： Suse Linux 操作系统，网站大部分用 Perl 编写，使用标准的 LAMP 组合，memcached 做缓存，使用 Sphinx 全文搜索。

craigslist internals overview

数据库

所有数据库服务器都运行 64 位的 Linux，每个服务器有 16GB 内存和16个硬盘。几台数据库服务器组成一个 db cluster，每个 db cluster 运行一个 Craigslist 服务。

forums：1个 master + 1个 slave，slave 主要用来备份，表使用 myIsam 引擎，DataDir 大小达到 17GB（包括索引在内），最大一个表有近4200万行。

classifeds：1个 master + 12个 slaves，多种不同用途的 slaves，其中 teamreader, longreader, thrashbox 用来备份以及一些非常耗时的特殊查询。还有1个离线 slave 以应付突发情况，比如 colo 崩溃了。其中数据库容积达到 114G（包括索引），最大一个表达到5600万条记录，数据表也是使用 myIsam 引擎。

archivedb：1个 master + 1个 slave，用来归档那些时间超过3个月的帖子，除了比上面的 classifeds 存的数据量大以外，其结构非常类似 classifeds，238G 的数据，9600万条记录。不同的是数据表使用的是 mrg_mylsam，MySQL 的 merge 引擎，方便把 archive 上分散的数据 merge 成更容易管理的块。这也是 merge 表的好处，这里一张表，那里一张表不方便管理，合成一张表更容易管理一些，不过 merge 引擎要求相似的表才能 merge，不是随便什么表都可以 merge 的。

searchdbs：4个 clusters（16台服务器），把 live 的帖子按照 area/category 切分，每个 cluster 只包含一部分的 live 帖子，使用 myIsam 全文索引。不过要注意的是，全文索引（Indexing）很耗资源，很烧钱。

authdb：1个 master + 1个 slave，这个最小了，只是存一些临时、短暂的数据（transient data）。

MySQL 似乎在 64 位的机器上运行得更好一些。

全文搜索

Craigslist 刚开始使用了 MySQL 全文搜索（Full text indexing and searching），随着规模变大，MySQL 全文搜索逐渐不能应付要求，不能 scale，改用 Sphinx 做搜索，一段时间后发现 Sphinx 也不能满足需求，不能 scale，最后不得不 patch sphinx 以满足日益增长的庞大数据库和搜索需求。Craigslist 的经验是，在一张很大的表上做全文索引和搜索是行不通的，因为用户没有耐心去等待漫长的搜索过程，搜索结果往往不能在用户期望的时间内返回。

分类：Site Reliability | Performance | 没有评论

Netlog 的数据库及 LAMP 架构

2009年07月21日 | 标签: lamp, scaling, sharding

Database Sharding@Netlog 详细的描述了 Netlog 数据库架构的演变过程，文章浅显易懂，非常值得学习。本文数据、图片均来自：Database Sharding at Netlog, with MySQL and PHP

数据

约4000万活跃用户
每月约5000万独立访问
每月约50亿 PV 和每月 60亿 online minutes
在数据库 sharding 以前，高峰时期每秒3000次以上数据库查询
26种语言，30多个国家，5个最活跃的国家主要集中在欧洲

技术平台

Squid
Lighttpd, Apache
PHP
MySQL
Debian
Memcached
Sphinx
and many more.

Netlog 数据库架构的历史

netlog 从7年前的一个 hobby project 发展而来，数据库从单台服务器扩展到树型多台服务器。

继续阅读 »

分类：Site Reliability | Performance | 评论(5)

Wikipedia 的 LAMP 架构

2009年07月17日 | 标签: apc, lamp, memcached, scalability

Wikipedia.org 是个标准的运行在 LAMP 上的高流量网站，看看能从 Brion Vibber （CTO, Wikimedia Founation）的这篇讲义：Scaling and Managing LAMP at Wikimedia 学到些什么。（图片资源来自：Scaling and Managing LAMP at Wikimedia）

数据

每个月100亿 PV
高峰时后每秒达 50000 http requests
约400台 x86 服务器，约250台是 Web Server，剩下的基本上是 MySQL Server
只有7个工程师维护
每个月35000美元的带宽和 hosting 费用

LAMP

Wikipedia 是架在标准 LAMP 上的一个非常好的示例，以下是 Wikipedia.org 用到的一些 stack：

多个不同版本的 Linux，Ubuntu，Debian 等
Apache
PHP
MySQL

Cache

缓存就不用说了，从前端的 web cache，中间的 opcode cache，到后端的 database cache 都需要。Wikipedia 用 Squid + APC + memcached 来完成 cache 工作。Squid 对 wiki 这种内容为主，不经常变化的相对静态的 web 应用很有效。Wikipedia 还用 Squid 做 geographic load balancing，根据不同地理位置访问各地的服务器。只要用到 PHP　的地方就应该用到 opcode cache，Wikipedia.org 选择了 APC，good choice!，VPSee.com 也用 APC：）。memcached 用来缓存数据库的临时 object，不用反复从数据库读取，而且 memcached 可以做成缓存服务器供网上 share object，其他的服务器可以直接读取，比起从磁盘重新读取数据库，网络读取的延迟要小多了。现在大家都用 cache，送礼就送 cache（cash？）！

继续阅读 »

分类：Site Reliability | Performance | 没有评论

随机

Michael Li: 2023年了，我是刚入门的新手，没想到十年前的帖子竟然还有这么多人在回复没想到mac vs win的话题这么久以前就有我已经买了新款mac哈哈哈哈首页上作者的帖子似乎停在了2015年，是不再更新了吗？
lqs: 看到进度条，震惊了，往下翻，果然评论更新到最近。。。话说这种评论系统是啥啊？怎么防止垃圾信息？
yu: 我还以为是个老贴，没想到还有这么新的消息！！！macmini m1到手后感觉不太习惯，目前就感觉那个终端确实比较好用，其他的感觉好像没太大区别，还有就是因为工作是做前端三维方面的开发，这块感觉还是有高端显卡的游戏本或台式机性价比比较高，macmini m1如果渲染一些bim模型或者大场景会卡顿，目前macmini被我当服务器在用，跑一些简单的服务，感觉没发挥应有价值，各位大佬有什么建议或者教程，欢迎指导一下我
mailer3721: 2023年了，这个帖子还在持续增长看着自己2012年、2014年的回帖很感慨这几年什么样的系统都用过，但目前要换电脑时还是会纠结买ThinkPad好还是买MacBook pro，可谓此恨绵绵无绝期，细细分析，感觉其实每个系统都有让你别扭的不足，关键还是看自己重度使用的场景，投奔什么阵营。
firfor: 我把这些整理到一个mac初始化脚本了，不过主要是java后端开发人员使用。如果有需要的直接拿走吧。代码： https://github.com/jianhong-li/macbookpro-env-init
庆丰大帝: 我已经连任三届了你们还在争吵哪个好 ^ ^
Lorre: dwm我的超人！
lycnsc: 希望继续，不要停话说2022年的 Macbook Air M2 24GB memory 的很爽
russel: 回viktor。早期的帖子反而大家都很和气，越临近现在反而更容易争吵，viktor的评论内容不是反问就是拿自己来比较，踩别人一头，完全看不出来有任何指导性的建议，更像是居高临下的教训，即使你有很高的水平，就这份自大也会让人恶心。
Anonymous: 我也觉吖，XP系统比后面的WIN7~wiN10的字体看起来都舒服。

友链

LinuxTOY