手撕包菜网站
使用CentOS7操作系统。
-
按照MongoDB ''' yum install mongodb mongodb-server '''
-
运行MongoDB ''' service mongod start '''
-
按照nodejs10 ''' curl -sL https://rpm.nodesource.com/setup_10.x | bash - yum install nodejs '''
-
安装pm2 ''' npm install -g pm2 '''
-
运行环境 ''' cd spider && npm install && cd .. cd web && npm install && npm run build && cd .. '''
-
启动爬虫 ''' cd spider/ && pm2 start ecosystem.config.js && cd .. '''
-
启动web ''' cd web && pm2 start ecosystem.config.js && cd .. '''
-
配置web 配置nginx访问web页面。 ''' yum install nginx service nginx start vim /etc/nginx/conf.d/ssbc.conf '''
加入以下配置。 ''' server { listen 80; server_name www.xxx.com; location / { proxy_pass http://localhost:3001; } } '''
-
安装SphinxSearch ''' yum install http://sphinxsearch.com/files/sphinx-2.3.2-1.rhel7.x86_64.rpm '''
-
创建目录 ''' mkdir -p /data/bt/index/db /data/bt/index/binlog '''
-
初始化索引 ''' cd spider indexer -c sphinx.conf hash searchd -c sphinx.conf '''
这是 www.shousibaocai.org 的网站源代码。 开源的目的是为了促进技术交流和相互学习,把DHT与搜索引擎技术应用到更广泛的领域去。
本站于2015年5月使用django改写。 本站于2019年使用nodejs改写。 与爬虫相关的代码都在目录spider目录下。
相关文章请查看作者博客: http://xiaoxia.org/2015/05/15/shousibaocai-opensource/