123456789101112131415161718192021222324252627282930313233343536 |
- # 这是一个示例 Python 脚本。
- # 按 ⌃R 执行或将其替换为您的代码。
- # 按 双击 ⇧ 在所有地方搜索类、文件、工具窗口、操作和设置。
- import scrapy
- class QuotesSpider(scrapy.Spider):
- name = "quotes"
- def start_requests(self):
- urls = [
- 'https://quotes.toscrape.com/page/1/',
- 'https://quotes.toscrape.com/page/2/',
- ]
- for url in urls:
- yield scrapy.Request(url=url, callback=self.parse)
- def parse(self, response):
- page = response.url.split("/")[-2]
- filename = f'quotes-{page}.html'
- with open(filename, 'wb') as f:
- f.write(response.body)
- self.log(f'Saved file {filename}')
- def print_hi(name):
- # 在下面的代码行中使用断点来调试脚本。
- QuotesSpider()
- print(f'Hi, {name}') # 按 ⌘F8 切换断点。
- # 按间距中的绿色按钮以运行脚本。
- if __name__ == '__main__':
- print_hi('PyCharm')
- # 访问 https://www.jetbrains.com/help/pycharm/ 获取 PyCharm 帮助
|