1>首先说数据来源:中华人民共和国国家统计局,数据在不停更新,但是作为一个比较大的层面,需要统计5级地区的数据,数据量异常大,比如我整合提供的地区数据在数据量上就已经达到了74W+,所以就算是国家统计局统计的数据也不能保证是最新的,要想获取第一手的新鲜资料,可以想办法去某宝或者某东爬取数据。但是,作为一个技术人员,我觉得长期爬取别人的数据也不是办法,别人数据更新一次你就爬取一次?所以个人认为在自己的系统里建立合法完善的地区增删改才是最重要的。2>然后是数据分析:纵览所有抓取到的数据,在地区编码上,全部采用12位整数编码,一二三级行政区域占2位,四五级行政区域占3位。数据库在设计的时候要注意,不能用varchar来代替bigint,查询速度上字符