数据集类型是数据科学和机器学习项目的基础,以下是常见分类及示例:
1. 结构化数据 📊
以表格形式组织,包含明确的行和列,如:
- 用户信息表(姓名、年龄、地址)
- 销售记录(订单号、商品、价格)
🔗 点击查看结构化数据示例
2. 非结构化数据 📝
无固定格式,需通过处理提取信息,例如:
- 文本文件(PDF、Word)
- 图像(JPG、PNG)
- 视频文件
3. 半结构化数据 🧩
包含标签或嵌套结构,如:
- JSON 数据
- XML 文件
- NoSQL 数据库记录
扩展学习 📚
想深入了解数据集应用场景?
点击查看数据集使用指南