📌 1. 环境搭建

  • 安装 Python(推荐3.9+版本)
  • 选择开发工具:
    • 🖥️ VS Code(下载地址
    • 📦 Anaconda(科学计算场景更佳)
  • 配置虚拟环境:
    python -m venv my_env
    source my_env/bin/activate  # Linux/Mac
    my_env\Scripts\activate     # Windows
    

🧱 2. 项目结构设计

  • 初始化项目目录:
    mkdir my_project
    cd my_project
    
  • 标准目录布局示例:
    my_project/
    ├── main.py        # 核心逻辑
    ├── requirements.txt  # 依赖管理
    └── README.md     # 项目说明
    
  • 添加 项目结构图 以直观展示层级关系

🧪 3. 实战示例:爬虫项目

  • 目标:抓取豆瓣电影Top250榜单
  • 步骤:
    1. 安装依赖:
      pip install requests beautifulsoup4
      
    2. 编写核心代码:
      import requests
      from bs4 import BeautifulSoup
      
      url = 'https://movie.douban.com/top250'
      headers = {'User-Agent': 'Mozilla/5.0'}
      response = requests.get(url, headers=headers)
      soup = BeautifulSoup(response.text, 'html.parser')
      
    3. 提取数据并保存:
      movies = soup.select('.item')
      with open('top250.txt', 'w') as f:
          for movie in movies:
              title = movie.select_one('span.title').text
              f.write(title + '\n')
      
  • 添加 爬虫示意图 说明数据抓取过程

📚 4. 扩展阅读

🛠️ 5. 实战小贴士

Python项目实战教程