Python-基础爬虫学习(一)
+++primary 什么是爬虫?爬虫是一种自动化程序,它按照一定的规则来爬取互联网上的各种有用的信息,为自己所用。爬取信息前务必遵守网站的robots协议,遵守网站服务条款,严禁爬取网站用户个人信息!! 爬虫的基本流程·发送请求·解析网页·提取数据·存储数据+++先来一些简单的小例子!;;;id1 豆瓣排行榜 12345678910111213141516171819202122#导入两个必要的库 requests用来发送请求 BeautifulSoup用来解析网页内容 import requests from bs4 import BeautifulSoup #确定要爬取的网页 url = "http://movie.douban.com/top250" #设置请求头,模拟真实浏览器访问,否则可能会被阻止访问 hearders = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (...
建站初期的免费虚拟主机(四)
继续接接······本文所分享的主机来自于网络收集,无法保证质量,请自行测试! 性质 主机商 空间大小 强制广告 自设广告 上传文件方式 可运行脚本 域名设置 评分 访问 Personal, Business OrgFree 1,500 MB Banner Allowed FTP, Browser PHP, SSI Domain, Subdomain 81 Review Personal, Business RedWebHost 250 MB No Allowed FTP, Browser CGI, PHP, Perl Domain, Subdomain 68 Review Personal, Business ReunionWatch 50 MB Banner-Top Allowed Browser, SiteCopy ISML Subdomain 14 Review Personal, Business SafeWebShop 50 MB Banner-Top Allowed Browser, SiteCopy ISML Subdomain 20 ...
建站初期的免费虚拟主机(三)
继续接······本文所分享的主机来自于网络收集,无法保证质量,请自行测试! 性质 主机商 空间大小 强制广告 自设广告 上传文件方式 可运行脚本 域名设置 评分 访问 Personal, Business FreeSiteHosting 1,000 MB No Allowed FTP, Browser CGI, PHP, Perl Domain, Subdomain 68 Review Personal, Business FreeWebPageHost 1,000 MB No Allowed FTP, Browser CGI, PHP, Perl Domain, Subdomain 68 Review Personal, Business FreeWebspace 50 MB Banner-Top Allowed Browser, SiteCopy ISML Subdomain 14 Review Personal, Business GoBot 50 MB Banner-Top Allowed Browser, SiteCopy ISML Sub...
建站初期的免费虚拟主机(二)
接上文······本文所分享的主机来自于网络收集,无法保证质量,请自行测试! 性质 主机商 空间大小 强制广告 自设广告 上传文件方式 可运行脚本 域名设置 评分 访问 Personal, Business BizHosting 50 MB Banner-Top Allowed Browser, SiteCopy ISML Subdomain 20 Review Personal, Business BraveNet 5 MB Banner-Top + Popup Allowed Browser SSI Domain, Subdomain 52 Review Personal, Business ByetHost 1,000 MB No Allowed FTP, Browser PHP Domain, Subdomain 102 Review Personal, Business CartWebHosting 300 MB No Allowed FTP, Browser PHP Domain, Subdomain 56 Review Persona...
建站初期的免费虚拟主机(一)
前言 免费虚拟主机作为一种公益产品,给建站小白提供了无比便利的测试建站平台。你可以搭建一个博客——例如typecho、emlog,抑或是功能更多的wordpress。博主的博客框架是hexo,基于github pages,这个需要花费很多的精力,因为大部分操作都是基于命令行,但是它的优点是虚拟主机和云服务器比不了的,这个我们后面再谈。 不光是博客,你还可以搭建其他网站,不过也是需要要求虚拟主机拥有的环境。根据我的经验,国内的大部分虚拟主机只有php环境,而许多国外老厂的虚拟主机有其他环境例如python、node.js等等,甚至还带有ssh连接权限。接下来我就分享一些经过收集的虚拟主机。怎么说呢,多到用不完。 本文所分享的主机来自于网络收集,无法保证质量,请自行测试! 性质 主机商 空间大小 强制广告 自设广告 上传文件方式 可运行脚本 域名设置 评分 访问 Personal, Business 00space 50 MB Banner-Top Allowed Browser, SiteCopy ISML Subdomain 14 Review Per...
关于Hexo部署(hexo d)错误的解决方法
从内地放假回到家后,打开电脑准备修改一下博客,突然发现hexo d命令开始报错 1234567891011ssh: connect to host ssh.github.com port 443: Connection refusedfatal: Could not read from remote repository.Please make sure you have the correct access rightsand the repository exists.FATAL Something's wrong. Maybe you can find the solution here: https://hexo.io/docs/troubleshooting.htmlError: Spawn failed at ChildProcess.<anonymous> (D:\blog\node_modules\hexo-deployer-git\node_modules\hexo-util\lib\spawn.js:51:21) at Chi...
记录一下Gihub Pages自定义域名
一、前言之前也搞过Github Pages自定义域名,后来忘了不知道什么原因删除了。现在又想起来换一个自己想要的好看的域名——“suns.blogu.tc”,“suns”代表我自己,“blog”代表是一个博客,属实是比较完美了! 二、教程开始1.验证域名 准备好你要使用的域名,打开github主页, 点击右上角头像,依次选择 进入页面后点击“Add a domain”,输入你要使用的域名并完成TXT验证 就是在你的dns托管处添加一条TXT记录,这一步完成后验证域名就算成功了。 注:DNS解析需要时间,请耐心等待 2.添加域名找到你的博客项目,并进入点击上方的Settings,在下一个页面找到Pages并点击进入, 下拉找到Custom domain在输入框中填写你要使用的域名(这个域名一定是要验证过的)然后返回DNS托管商处,添加一条CNAME记录或者一条A记录(ipv4)、AAAA记录(ipv6)CNAME: 12指向example.github.io(example换成你的) A: 12345指向以下四条ip185.199.108.153185.199.1...
Cloudflare for SaaS(回源加速)自定义主机名
双向解析的域名配置好了可以直接进行优选,那么不能进行双向解析的域名如何进行优选呢?没错,便是Cloudflare自带的自定义主机名功能,接下来我就介绍一下如何使用自定义主机名功能来实现优选域名CDN加速! 一、准备工作两个可以托管到cloudflare的域名(我这里使用5200810.xyz(以下称主域名)和kuiyr.ggff.net(辅助域名)) 首先,确定好你要使用的主域名,比如说你要在你的云服务器或虚拟主机上绑定的域名。像我要使用’5200810.xyz’作为网站域名。 再确定好辅助域名,我这里就是’kuiyr.ggff.net’ 二、教程开始 1.转到辅助域名的DNS解析,添加两条记录。首先添加一条CNAME记录,名称为cdn,内容指向你找到的优选域名;再添加一条A记录或CNAME记录(虚拟主机可能用得到CNAME记录),名称填写origin,内容指向你服务器的公网ip或者虚拟主机的ip或域名。结果如下图, 2.在(辅助域名)左侧栏找到选项SSL/TLS,点击后找到自定义主机名——>添加回退源,将origin开头的子域名填入,像我就是‘origin...