[互联网] 百度等其他搜寻引擎爬虫爬取的网页原始码是?

[复制链接]
查看4 | 回复0 | 2022-11-24 17:04 | 显示全部楼层 |阅读模式
问题:
百度等其他搜寻引擎爬虫爬取的网页原始码是?

拿大家最常用的chrome浏览器来看,网页查看原始码方式有二种
1.键盘Ctrl+U查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码
2.键盘F12检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染
有些网页是Javascript渲染的技术建置,所以会有Ctrl+U查不到文字,而F12查的到内文
因此想问大家,百度爬虫的话,是爬取Ctrl+U还是F12的原始码?


推荐答案:

  • 众市皮绿四跑何顾刻计我所知,百度的蜘蛛只能爬到静态内容的,如果是JS渲染的,它爬不到的
  • 所以,就有 SEO 优化,比如 vue,react,就有对来自应的服务端渲染 SSR
【玉璞集 YUPUG.COM】