跳转至

Python编程实验:爬虫与信息系统

实验目标

  • 爬虫:
    • 掌握Python的简单爬虫功能
    • 掌握提取爬虫获取的关键信息
  • 编写网站:
    • 掌握Django技术,编写信息整合的基础网站
    • 掌握信息检索系统
  • 数据分析:
    • 掌握数据可视化技术和数据分析方法

实验概述

在过去的一年里,科学技术的进展日新月异,给世人带来无数的激动时刻:

2022年11月,OpenAI公布由大型语言模型微调而成的全新对话式AI模型ChatGPT;2023年3月,OpenAI发布多模态大模型GPT-4;2023年7月,韩国研究者宣布自己发现了全球首个室温超导材料LK-99;……

你也许会有这样的好奇:

过去一年里究竟都有哪些引起世人关注的科技进展?在不同的时间,不同的技术(人工智能、云计算、超导,等等)在新闻报道中如何被讨论,热度有什么变化?其背后能否挖掘出技术进展与社会舆论之间的互动联系?

在本次的实验中,你将实现如下的功能:

  1. 获取数据:你可以通过爬虫技术爬取科技新闻,通过数据处理技术得到需要的数据;
  2. 展示数据:你可以编写网站,有条理地展示你的数据,通过检索技术实现信息的高效获取;
  3. 分析数据:你可以通过数据可视化和数据分析的技术,挖掘数据背后有价值的结论。

最后更新: 2023年8月24日
作者:xujz18