拓扑图形整合地理编码参照(TIGER)报告

首页 > 国际 > 正文
2021-05-12

发表自话题:第七次人口普查数据结构

人口普查不确定性的重大来源之一是少算了各种群体,许多群体(不是全部)被社会边缘化,它们被称作:“雪鸟”, 例如:代表着一大部分的冬天人口的、有着超过社会平均收入的、退休的美国人在很多地区也很难查点。另一个少计算了的群体,包括在农业地区和采掘工业例如:石油、天然气和矿山,工作的没有档案材料的移民工人,他们中不是所有人都是低技能的人和/或非法外国人。

 

偏差的特点:

少算的工人是一个大的、发展快速的和持续多样化的人口群体;目前的估计是从2百万到1千3百5十万不等,在经济上这个群体对美国的全球竞争力起到非常重要的作用。他们中的大多数被人口普查漏掉的人是由于他们从来都没有对人口普查的文件做出答复,以及没有在人口调查期间被登记进看起来有人住的住宅,当计算已登记的居民时,这些人被指派作为附加的居民,他们的属性特点是这个住宅区的其他居民。这样的做法也许适合其他的普通人口,但是,由于没有档案材料的工人大部分都是男人(共同使用装置和工作倒班)以及家庭可能有更多的男孩子,并且穷困、教育程度低。

 

 

身份欺诈

美国人口普查局(USCB) 在计算非法外国人上作出了很多努力,例如:通过清楚申明人口调查文件和表格不会与法律执行部门分享。然而,在2001年9月11日的袭击之后,美国人口普查局(USCB) 确实跟其它的政府部门分享了“阿拉伯人”每个人的邮政编码。这项工作如果拥有多语言的材料和对外努力就会有相当的成功。一个安全国家的身份证会成为一个长期的解决方案来更好的处理人口的规模。如果采用这个方法,也会有这样的功效:发现大量的多重身份的人和那些已经死亡很久的人,而他们的亲属还在欺诈性地从他们身上受益。出生证明、驾照、社会保险、电话公司、美国人口调查和其它资料库的统一化,也会有这样的好处:使身份欺诈变得更困难,并且能找到据估计有100万的逃犯。

 

躲避人口普查:

在最初分发人口普查表时,在统计未应答者的过程中,少计和多计也许就会发生。例如:由于被少计算了人口,犹他州失去了一个国会席位。犹他州在一个法庭文件中争辩说:Mormon 家族构成了犹他州居民的主要部分,他们比典型的美国家庭平均有更多的孩子,应该有更多的常住人口被登记。在国外做传道工作的姓Mormons 的人也没有被计算在内。有趣的是,犹他州并不试图争论本州有多达1万个一夫多妻的家庭。其他非传统群体,例如:大卫教派、奥修的追随者、和阿米什(Amish )人也不大可能被准确计算。尽管Amish人长期定居,只是因为他们想避免选民登记、陪审团服务和服兵役,而很可能躲避人口普查员。当然,试图在俄勒冈(Oregon)建立奥修社区(Rajneshpurnam)也对人口统计有影响。有趣的是,人口清查,或更准确地说,选民登记在奥修和他的失败的故事里扮演了一个非常关键的角色。他希望在18,000英亩的不动产土地上建立一个有几十万人的城市,登记的只有十个居民,而实际上这里有多达2000个永久居民,在每年的节日中,他们接待1万五千来访者,所以最后这个想赢得控制这个国家选举的企图失败了。

 

错误的计算:

发生多计少于少计的情况,可能出现在这样的地区:有很多季节性居住的假日住宅,以及在有些情况下,离家上学孩子被计算了两次,上学的孩子们自己答复了人口普查,而在家的其他人又代表孩子们进行了答复。另外,在国外工作的联邦工作人员也许不被当作普通未计算的驻外人员,而是被当作以该国为基地生活驻外人员;所以,以国内为基地的社区得以增加了人口,即使那些人一年只在那里呆几天或者有时候一去就是几年。大多数分析员只是简单地计算人口。然而,在一些地区,由于有一些机构例如监狱的存在也许会引起偏差的计算。例如,在德克萨斯的Huntsville 由很多的西班牙裔(Hispanics)人口(图1),但是,在这里,最高的人口集中情况跟五个州监狱、一个县监狱和一个大学宿舍有关。35,000居民中的6千人是犯人。虽然Walker在Huntsville是县的席位,人口稍微比6万多一点的Walker县有大约1万3 千名犯人。在美国的一些县,超过半数的人口是犯人,除非考虑这个事实,要不然就会使地区人口普查的数据的运用在许多方面失真。

 

周期:

在美 国十年一个周期进行的人口普查起始于1790年。如今,美国的家庭平均每四到五年就搬一次家,经常是搬出州。因为在人口调查1至3年后才能得到大多数人口普查数据,人口的特点和估计很有可能不准确。为了得到不同的年龄组、移出和移入数据,每年的估计和将来的估计都使用都牵涉到出生和死亡率的模式。一个解决方案是:美国社区调查(ACS)。对如今缺少的调查,美国社区调查在中间的年份中在选中的社区进行巡回抽点调查,用发生在这些“空缺”的年里的变化来补充人口普查的调查。

 

城市边界:

美国人口普查对一个城市内的人口估计,依赖于当地政府在发生增长和合并时在拓扑图形整合地理编码参照(TIGER)文档上对边界的更新。然而,在大多数情况下,城市边界跟人口普查的调查地区边界无关。在图2 中显示了错误结果的一个例子:粗(红)线代表美国人口普查所相信是德克萨斯州Conroe 市的市界。事实上,在那个时间,这个更大的阴影地区代表着正确的边界。在1990年和2000年间,从大约27,000到大约42,000的人口增加了数千居民,.这个更大的、包含了新的数千人的地方,但是在TIGER数据中也反映的地区被并入进这个城市的时间是在1990年而不是在2000年。

 

误解:

人口普查问的问题常常影响了应答的准确性。一般情况下,一个政府官员会提供有关任何被送入某机构的个人信息,例如:一名囚犯。因此可以准确报告年龄、性别和收入(通常为零),但是他将代表这个囚犯报告种族信息。在由一个官员来做种族的鉴别时,要像使这种指派的做法准确,可能需要采取某种客观的措施。弄清是否10% 或40%的纽约囚犯是“西班牙裔”,对改造工作和社区监督工作是会有效果的。错误的回答也许是故意或不经意造成的,例如:对收入的低报和对房屋价值的多报。某些人也许把一些问题理解为具有侮辱性,例如:那些关于婚姻状况、非婚生子、或混血儿童,以及居住在非传统家庭,例如:那些多妻家庭。使用者也许也错误地理解数据,例如:设想2000年的数据直到2012年对那些“空缺”年份也有效;管理被送入某些机构的人口,例如囚犯;令人混淆的条目,例如:“平均家庭收入”和“个人收入”,“家庭”和“家族”。

 

数据的错误使用:

地域人口统计资料经常被用于各种研究中,而人口普查资料的文件并不是为这些研究设计的,这样会导致错误使用。其中一个例子是从居住在一个的家庭的同性伴侣的计数中估计同性恋的人口。另外,街区、街区群体和居民点在拓扑图形整合地理编码参照(TIGER)中典型地被被来自这个单层、过时的、最小的人口清查区域的边界的TIGER数据结构限制,这个数据结构代表着道路或高速公路的轴线的街道划分,或者偶尔,铁路或水道的特征。街区的边界可以是多种多样的,许多街区可能人口很少或甚至根本就没人(图3)。然而,基本地域人口信息像种族、年龄和性别在街区层面是可以得到的,这些信息可以通过达成隐私和保密协定来做到,还有在美国人口普查局(USCB)试图保护得到信息的这些区域。这点尤其真实,当数据被公布到网上,这会允许任何有浏览器的人来判定个体家庭的特点;这样就有可能在城市里搜寻居住着单身的家和不同种族夫妻的街区。更有甚者,互联网上的公布资料可能对将来的人口普查带来危险,因为人们对侵犯他们的隐私很敏感。在2000 的人口普查中,一些对要求答复问题被一口拒绝的事在公众中得到了广泛的传播,一条已公布的被拒绝的例子可以代表了数千个人的看法,他们觉得美国人口普查局(USCB)没有权利探究他们的私人生活。对少于50个家庭(~150个人)的地籍数据进行限制是一个好方法。当不可避免会有人口少和“暴露的”少数民族的问题时,新的地域数据库结构可以被用来“遮盖”低人口地籍。一个更合适的方法会自动把某些地籍重新总和到更大的包括范围区域,封锁关于人口少的地区自身资料的发布,把它们和相邻的和周围的人口足够多的地籍总和在一起,这样来保护答复调查者的隐私。

 

正在消失的卡津人

人口普查十年一次的“详细的调查”被随机地操作成6个回答人选一个人,包括关于种族和回答人的民族起源。一个成员已经发生了极大变化的群体的卡津人应归属于这个问题。卡津人是法国加拿大人和在18世纪作为避难者来到路易斯安娜的圣多明哥(Santo Domingo)居民的后代。他们被集中安置于路易斯安娜南部,如图4 显示。卡津人作为一个可能存在的民族的例子记录在1990年人口普查中,当在2000 年的人口普查中这个说法就消失了。任何填写卡津人的回答者都被和其他法国加拿大人总括在一起,而法国加拿大人这个群体集中在美国的东北部。结果是在1990年和2000年间,超过400,000个卡津人明显地消失了。由于这个条目“西班牙裔”的意思不清楚引起了相关问题,这些人同样报告自己种族起源不跟一个实际的国籍相关,例如:一个来自土耳其的人报告他自己是库尔德人。.

 

结论:

TIGER 有很多各种各样持续引起问题的内容,解决方法是存在的,例如:一些问题可以使用人口估计或对送入某机构的人正确地核算,其它的方法可以利用可得到、现正出售的GIS软件包中的地域空间数据结构的正在进步的技术。我们相信,只有通过教育的努力和在内容和数据库工具的改善,在将来才能减少错误使用和错误理解的潜在可能、以及出错数据的比例。

 

致谢:

在此向 Jennifer Lorca、William Bosworth 博士 和Peter Wagner表示衷心的感谢!

参考文献:

-   Leipnik, Mark R. 和Sanjay S. Mehta (2005), 《电子营销的地理信息系统(GIS)》,《高级电子营销》, Idea Group出版, Irvine Clarke III和Theresa B. Flaherty编辑,第XI章,193-209页。

-   Peters, Alan 和 Heather MacDonald (2004), 《用GIS解密人口普查》, ERSI 出版社 Redlands CA, ISBN 1-58948-113-5.

-   Leipnik, Mark R., Sanjay S. Mehta, 和 Balasundram Maniam (2003),

介绍TIGER 2000, 营销管理协会春季教育者大会,芝加哥 IL,3月 12日-14日.

-   Brewer Cynthia 和 Trudy Suchan (2001), 《2000年绘图人口普查》: 美国地理 . 差异ESRI 出版社Redlands CA, ISBN 1-58498-014-7.

-   Mehta, Sanjay S、Leipnik, Mark R. 和Balasundram Maniam (1999),

《GIS在中小企业的应用》商业和企业家杂志Vol. 11 No. 2, 77-88页。

作者简介
Mark R. Leipnik 是助理教授、休斯敦州立大学地理和GIS实验室主任,他毕业于U.C. Santa Barbara ,写过两本关于GIS 的书秃芏辔恼拢绕涫窃谟头芍葱蟹矫娴奈恼隆?
Sanjay S. Mehta BS、MS、工商管理硕士、哲学博士,是Awardat萨姆•休斯敦州立大学2004 ‘杰出研究奖’的获奖者。他在仲裁会议上以及在特许经营、全球市场、电子商务,体育营销和GIS领域的学术刊物上提出和/或发表了超过120篇文章。

标签组:[人口普查] [地理

上一篇大数据怎样发现正在恶化的中国人口结构的_大数据_数据分析_数据结构_课课家

下一篇数据结构——笔记1

相关阅读

热门阅读