数据分析与知识发现, 2019, 3(5): 19-26
doi: 10.11925/infotech.2096-3467.2018.0881
基于数据挖掘方法的HEDONIC房屋价格评估模型——以美国城市西雅图为例
Appraising Home Prices with HEDONIC Model: Case Study of Seattle, U.S.
陈万成, 戴浩然, 金映含

摘要:

【目的】依据HEDONIC理论, 利用不同类型特征构建商品房价格评估模型, 为房屋价格评估工作提供一个效率更高、成本更低、准确性更高的解决方案。【方法】利用空间分析方法, 对预处理后的数据构造并选取重要特征, 基于随机森林、神经网络以及KNN建立融合模型。【结果】分析西雅图2014年至2015年商品房价格评估结果可以得出: 该模型明显优于线性HEDONIC模型, 准确度提升11.20%, 较为可靠。【局限】选取样本数据时, 时间截面并不完全一致, 导致模型存在潜在缺陷; 由于市场环境不同等多种因素, 将该模型运用于中国房屋价格的评估可能会存在偏差。【结论】本文提出的融合模型是一种较为可靠的房屋价格评估模型。

关键词: 房价评估 ; HEDONIC模型 ; 随机森林 ; 神经网络 ; KNN

Abstract:

[Objective] This paper proposes a model based on the HEDONIC theory, aiming to assess home prices more efficiently, cost-effectively and accurately. [Methods] We adopted the spatial analysis method to extract important features from pre-processed data. Then, we built the model with Random Forest, KNN and Neural Networks. [Results] We examined our model with property price data of Seattle (USA) from 2014 to 2015 and found its precision was 11.20% higher than the linear model. [Limitations] The sample data was not retrieved from the same time slice, which might affect the performance of our model. Using this model to assess home prices in China might be biased due to different market environment and other factors. [Conclusions] The proposed model is a reliable method to appraise property prices.

Key words: House Price Evaluation ; HEDONIC Model ; Random Forest ; Neural Network ; KNN

1 引 言

随着时代的进步、社会与经济的不断发展, 城市的更新改造进程日益加快, 催生了一系列相关的服务产业, 如第三方房产估值平台等。当今社会的房价评估体系存在多种缺陷: 评估效率低下、评估成本较高、评估准确性有待考量。人为评估易受主观因素的影响, 虽具有能动地考虑当地市场、政策等因素的能力, 但缺乏整个房价市场的数据支持, 降低了房价评估的公平性、科学性以及准确性。

基于数据的自动评估可以有效地回避传统估价难以克服的缺点。基于数据, 不仅在于得到精准的评估结果, 更重要的是体现社会服务的公平性和公正性, 要使纳税人认为自己受到的服务是平等的、有依据的[1]。为了提高房产估价的准确性, 有效减少由估价不合理而导致的相关房产的经济纠纷, 需要构建更合理的评估模型, 从而促进房地产市场的健康发展。

本研究利用西雅图房屋数据, 构造并选取重要特征, 基于随机森林、KNN、神经网络三种数据挖掘方法构建HEDONIC房屋价格预测模型, 为评估房屋价格提供指导与建议。

2 背 景
2.1 研究背景

Gloudemans在房屋价格评估中引入加法模型、乘法模型以及非线性模型, 并对自动化评估的应用进行详尽的描述[2]。Waugh于1928年发现商品属性与自身价格存在某种函数关系, 用回归分析方法找出蔬菜质量与蔬菜价格的关系, 估计商品属性所隐含的价格, 首次使用了HEDONIC模型[3]。Ridker等使用HEDONIC理论分析商品房属性数据, 对比市场价格, 计算出环境质量对住宅价格的影响[4]。Lancaster提出新消费者购买决策理论, 表明商品的市场真实价格是由需要商品的某些属性(服务)决定而不是商品自身决定[5]。Rosen从房地产交易中买卖双方对维持市场均衡的角度出发, 对供给侧结构、HEDONIC方程以及外界环境因素等方面进行分析, 奠定了HEDONIC模型的理论基础[6]。Chambers研究了人种、犯罪率等特征因素对住宅价格的影响[7]。Chica-Olmo分析了邻里因素和区位因素对房屋价格的影响[8]。HEDONIC模型中广泛采用的函数形式为线性函数形式、线性-对数函数形式、对数-线性函数形式、对数函数形式等, Wheeler等利用贝叶斯方法评估房屋价格, 得到了较好的效果[9]。Ceccato等分析了瑞典斯德哥尔摩约9 000套公寓销售数据以评估犯罪对房价的影响, 其研究结果表明, 无论犯罪类型如何, 特定区域的公寓价格都受到邻近地区犯罪活动的强烈影响; 当按类型划分犯罪时, 发生在住宅的入室盗窃、房屋破坏、殴打和抢劫行为都会对房屋价格产生重大负面影响[10]。Cohen等分析了水体与湿地对房屋价格的影响, 揭示了距离湿地和水体的远近对房屋价格影响在城市和农村方面的不同[11]。张维阳等通过住宅价格与距地铁站距离的回归模型的定量测算和空间插值的直观测度发现, 各地铁站点对住宅价格有不同程度的影响, 影响范围从0.5km~1km不等, 衰减比重为20%~35%, 且在影响范围内衰减程度逐渐降低[12]

2.2 城市背景

本文以美国西雅图房地产市场为研究对象, 为更好确定初始特征属性以及数据搜集的方向, 可以从自然环境和社会环境两个方向对西雅图的城市背景进行探究。

(1) 自然环境

①地理位置与气候

西雅图位于华盛顿州金郡, 靠近美国西海岸, 受海洋影响较大, 属于温带海洋性气候, 气温变化和缓; 素有“雨城”之称, 降雨频繁, 冬季较多, 夏季相对较少, 年均有效降雨日数152天[13]

②水 体

西雅图东邻华盛顿湖, 西靠皮吉特湾, 湖湾众多。降水丰富, 河流湖泊众多, 地势平坦, 气温较低, 蒸发较弱, 独特的气候和地理环境造就了西雅图丰富的湿地与沼泽。湿地占地面积0.10%, 沼泽占地面积0.33%(①使用ArcGIS软件处理西雅图湿地分布以及沼泽分布SHP文件所得结果。)。

③地质活动

西雅图地质活动强烈, 地震是西雅图面对的最大的潜在威胁。断层带东西贯穿城市中心。由于地质运动所引发的地震, 地表水冲刷和浸泡, 降雨以及人类工程活动频繁, 西雅图滑坡与潜在滑坡区域较大, 多分布于河、湖湾的斜坡。潜在滑坡区占地面积8.35%(②使用ArcGIS软件处理西雅图潜在滑坡区SHP文件所得结果。)。在发生强烈的(7级及以上)断层地震之后, 西雅图山体滑坡风险较大。

(2) 社会环境

①教 育

西雅图拥有高于美国平均值的教育水平。美国人口调查局2014年的统计显示: 西雅图学士学位以上的人口占57.9%, 全美平均值为29.3%[14]

②公 园

西雅图公园众多。城市公园的发达程度和规模印证了城市住宅的居住价值。市区公园拥有完善的基础设施、成熟的交通系统以及自然景观资源, 因此公园地产是一个城市非常理想的居住地。

③交 通

西雅图拥有一条轻轨: 北起中部联合湖, 南至西雅图南部并向南延伸至布林恩。2014年西雅图公共交通在出行方式排名中处于第二, 为21.0%; 私家车出行方式仍占据出行方式的主体, 排名第一, 为48.5%[15]

④犯 罪

西雅图的财产犯罪率较高, 暴力犯罪从2014年的2 513次升至2015年的2 653次。在美国, 暴力犯罪的估计率为每10万城市居民383.2次。西雅图的财产犯罪率从2014年的42 295次下降到2015年的39 378次[16]

西雅图2014年部分自然与社会属性分布如图1所示。

图1 2014年西雅图部分自然与社会属性空间分布(①数据来源: Seattle governaent, data. seattle. gov。)

3 研究框架与方法
3.1 HEDONIC模型

HEDONIC模型又称为特征价格模型, 该理论认为, 一种商品具有多个不同特征或品质, 商品价格则是所有特征的综合作用和体现。在统一的市场, 商品的异质性完全竞争假设下[17], 商品住宅价值由众多不同的特征组成, 而商品住宅价格是由所有特征带来的效用所决定。

(1) HEDONIC模型的形式

价格隐含在各个属性中。本文研究对象为商品住宅, 其位置、房屋内部条件、邻里等特征属性均存在异质性。

HEDONIC的主要函数形式有: 线性函数形式、对数函数形式、线性与对数函数结合形式。HEDONIC模型没有固定的形式, 需要根据实际情况确定。各个多种形式可以归结为一个统一的形式, 如公式(1)所示。

$P=f({{x}_{1}},{{x}_{2}},{{x}_{3}},\cdot \cdot \cdot {{x}_{n}})$ (1)

(2) HEDONIC模型的优缺点

HEDONIC模型可以同时分析商品的多特征属性并表明其经济意义。缺点是运用特征价格过程中容易产生多重共线性而使回归过程产生不同程度的偏差; 另外, 商品价格的特殊性、例外性会对整个模型造成一定干扰, 掩盖市场供求关系对价格的影响。

(3) 基于数据挖掘方法的HEDONIC模型

基于前人利用HEDONIC模型进行房地产评估所参考因素以及HEDONIC模型在房地产评估中已被认可的有效性, 本文通过BP神经网络、随机森林算法以及KNN算法对重要特征进行学习, 建立房屋特征与房屋价格的关系模型, 得到优于线性模型的评估效果, 如公式(2)所示。

$P=\alpha {{P}_{rf}}+\beta {{P}_{knn}}+\gamma {{P}_{nn}}$ (2)

其中, P表示商品价格; Prf表示随机森林模型评估结果; Pknn表示KNN模型评估结果; Pnn表示神经网络模型评估结果; α, β, γ分别为随机森林模型、KNN模型、神经网络模型评估结果在整个评估模型中所占权重。

3.2 房价评估模型建立方案

HEDONIC模型表明, 房屋价格与其建筑因素, 周围环境的邻里、区位因素有关。如图2所示, 为了更好地研究房屋价格的组成因素, 本研究在对城市数据进行预处理以及特征构造后, 使用特征选择方式提取重要特征, 并运用到最后的模型建立环节。

图2 基于城市数据建立房价评估模型的研究流程

(1) 预处理: 对于数据集中的缺失数据, 使用众数插值等方式进行填补; 使用箱式检验辨别离散数据并进行剔除; 对于长尾数据, 使用对数变化等方法进行处理。利用ArcGIS中的地理分析工具, 进行邻里、区位因素的特征构造。

(2) 特征选择: 通过稳定性检验、递归特征消除法、线性回归、岭回归、套索回归以及随机森林特征重要性排名的综合结果, 构造重要性排名矩阵, 对特征属性进行筛选。并基于上述6个模型得到的特征重要性结果的均值作为各个特征的重要性, 在数据集中去除重要性小于等于0.1的属性特征。同时根据皮尔森相关系数, 去除高相关系数中重要性较低的系数。

(3) 建模: 利用随机算子, 将数据集按6:2:2的比例划分为训练集、验证集、测试集。分别利用随机森林、KNN、神经网络模型进行模型构建, 最后使用融合模型的方法评估房屋价格。

4 研究过程

根据相关研究经验及结论, 结合西雅图自身的城市背景, 选取特征属性。

4.1 数据集

(1) 原始属性数据集

原始属性数据集来源于美国华盛顿州国王郡2014年5月-2015年5月的房产交易数据, 并经过相关数据预处理。

西雅图区域平均房屋售价约48.04万美元; 平均房龄约61年(最大房龄为114年), 房间面积为1 550.67平方英尺, 庭院面积为4 065.18平方英尺。

①商品房建筑因素: 卧室数, 盥洗室数, 楼层数, 房间面积, 庭院面积, 除地下室外房间面积, 地下室面积, 2015年重测的房间面积, 2015年重测的庭院面积, 经度, 纬度, 建筑年份, 重装修年份。

②邻里因素: 景观评分, 是否邻水。

③区位因素: 邮政编码。

房屋综合得分为以上三个因素的综合, 日期与交易ID并未放入房屋价格特征中。

(2) 构造属性数据集

①区域平均房价

按邮政编码对该区域房价进行聚类统计, 得到新的有序变量: 区域平均房价如公式(3)所示。

$AvgPric{{e}_{i}}=\frac{\mathop{\sum }_{1}^{{{n}_{i}}}Pric{{e}_{{{n}_{i}}}}}{\mathop{\sum }_{1}^{{{n}_{i}}}{{n}_{i}}}(i=1,2,\cdot \cdot \cdot {{N}_{zip}})$ (3)

其中, $AvgPric{{e}_{i}}$表示第i个区域的平均房价; $Pric{{e}_{{{n}_{i}}}}$表示第i个区域的第n个商品房的房价; ni表示第i个区域的商品房总数; Nzip表示第i个区域的商品房总数。

对所求得的平均房价分级赋值, 如表1所示。

表1 区域平均房价属性赋值分级

②最短距离

商品房所在位置与特定点或区域之间的欧氏距离。

③区域犯罪指数

犯罪指数定义为每个街区中所发生的特定种类犯罪次数与该街区的面积之比, 如公式(4)所示。

$IndexCrim{{e}_{i}}=\frac{\mathop{\sum }^{}Crim{{e}_{i,m}}}{{{f}_{area}}(Ne{{i}_{k}})}$ (4)

$(k=1,2,3\cdot \cdot \cdot {{N}_{nei}}\mathrm{;}\ i=1,2,3\cdot \cdot \cdot {{N}_{cri\text{-}type}}\mathrm{;}\ m=1,2,3\cdot \cdot \cdot {{N}_{cri\text{-}recor{{d}_{i}}}})$

其中, IndexCrimei表示第i种犯罪类型的区域犯罪指数; Crimei,m表示第i种犯罪类型的第m条记录; Nnei表示商品房总数; Ncri-type表示犯罪类型的总数; Ncri-recordi表示第i种犯罪类型的记录总数。

④商品房缓冲区犯罪统计数

效仿Perry提出的邻里单位概念[18], 以房屋为中心, 500米为半径来考虑周边犯罪特征对房屋价格的影响。

对每个商品房做一个半径为500米的缓冲区, 使用空间面与点的交集方法求出每个商品房缓冲区内特定犯罪次数总和。

4.2 数据规约与特征属性的选择

(1) 特征属性重要性排名矩阵

通过稳定性检验、递归特征消除法、线性回归、岭回归、套索回归特征以及随机森林特征重要性排名的综合结果, 构造重要性排名矩阵, 对特征属性进行筛选。基于计算得到的各个特征重要性值, 在数据集中去除重要性小于等于0.1的属性特征。

(2) 相关性分析

对于“是否邻水”之外的属性, 采用皮尔森相关系数检验, 以0.8为极强相关阈值, 在特征选择中, 需要删除极强相关的两个特征中重要性较小的一项, 以降低数据的冗余性。

剔除超过阈值的劣势特征属性: 区域平均盗窃事件数、区域平均非法侵占事件数、区域平均骚扰事件数和区域平均恶意损坏事件数。最终得到的重要特征如表2所示。

表2 重要特征及其重要性值

5 模 型

数据集中共有6 190条记录。利用随机算子, 将数据集中的60%数据作为训练集, 20%数据作为验证集, 剩余20%数据作为测试集。

5.1 随机森林模型

为节省验证集数据开销, 采用Bagging技术, 使得在训练决策树时每棵树都有袋外样本, 可使用袋外样本作为验证集, 利用袋外样本误差代替验证集误差。对随机森林初始参数作如下设置:

(1) 决策树的数量设置为50;

(2) 使用均方差误差函数作为决策树节点分裂评价函数;

(3) 分割内部节点所需要的最小样本数设置为2;

(4) 每个叶子节点所装载的最小样本数设置为5;

(5) 使用袋外误差数据代替验证集错误。

对于随机森林模型, 森林的广度和深度受决策树数量以及每个叶子节点所承载的最小样本数影响较大, 因此采用循环方式, 对这两个参数进行调整。寻找决策树数量在50-501(步长为50)、叶子节点承载最小样本数在5-106(步长为20)的最佳组合。

对于组合情况的遍历, 选取误差最小的参数组合——决策树数量为1 500, 每个叶子节点最少承载的样本数5为作为最终参数设定。

5.2 KNN模型

在KNN回归中, 通过计算得到至每个较近样本的距离, 选取前k个最近样本, 计算其平均值。k值的选取对模型的优劣至关重要, 需要对该参数进行调整:

(1) k值初始设为5;

(2) 设置KNN使用的变量为反距离权重;

(3) 循环中为其设置起始值为3-50(步长为2), 分别建模评估;

(4) 找到使得误差最小的k值, 设定最终参数k为7。

5.3 神经网络模型

人工神经网络是一种以模拟生物神经网络进行信息处理的数学模型。本文采用BP神经网络算法, 利用其反向传播特征, 即用输出后的误差估计输出层直接前导层的误差。再利用此误差估计再前一层的误差, 如此迭代。最后, 通过判断计算误差是否小于上限以及学习次数是否达到指定值来结束学习过程。

使用Relu作为激活函数, 采用BP神经网络作为修正误差算法, 创建3个隐藏层, 每层设置8个神经元。

设置参数后, 需要确定模型建立时迭代的次数以及每次读入的数据个数, 因为其直接显著影响模型误差。

采用循环方法, 将迭代次数设定范围为200-400(步长为20), 每次读入数据量设定范围为100-200(步长为20)。分别利用两个参数的不同组合情况构建不同的模型, 选取误差比例较小的模型, 从而得到较为理想的参数组合。

对组合情况的遍历, 选取误差最小的参数组合: 选取迭代次数480次, 每次读入数据260组作为最终参数。

5.4 融合模型

将三个在验证集调参后的模型在验证集上作加权平均以平滑误差, 得到最终模型, 见公式(2)。

利用验证集进行线性模型构造后, 三种模型的参数分别如下:

$\alpha =0.410750\ \ \beta =0.153380\ \ \gamma =0.435870$

即: $P=0.410750{{P}_{rf}}+0.153380{{P}_{knn}}+0.435870{{P}_{nn}}$

6 结 果
6.1 模型检验与评价

建立最终模型后, 利用验证集中得到的三种模型预测值以及房屋价格真实值建立线性回归模型, 利用测试集数据比较融合模型房价预测的绝对误差和相对误差。

在测试集(1 238条数据)中对线性模型、随机森林模型、神经网络模型、KNN模型、融合模型进行评估准确性的验证。随机选取8组数据, 其结果如表3所示。

表3 使用不同模型评估误差对比

对所有测试集误差分析结果作求平均值处理, 得到评估的绝对误差的平均值以及相对误差平均值, 如表4所示。

表4 不同模型的验证集检验结果

由验证结果可以看出, 融合模型误差平均值为5个模型中最小的。融合模型相对于线性模型准确度提升11.20%, 相对于随机森林模型准确度提升4.53%, 相对于神经网络模型准确度提升4.14%, 相对于KNN模型准确度提升16.71%。

本文提出的融合模型优于线性模型, 并在准确度上有较大幅度的提升。融合模型的建立可以在一定程度上综合各子模型的优势以得到更好的评价结果。

6.2 模型不足

本文所建立的模型也存在局限:

(1) 对于三种模型, 通过迭代确定的较优参数个数较少。只选取对模型影响最大的参数进行比较, 而对于其余的参数并未进行考虑, 由于每次寻找参数需要的迭代时间较长, 调参范围以及步长受到限制, 对单个模型精度存在影响。

(2) 房价受到当地政策的影响较大, 并未考虑2014年-2015年的房地产市场情况, 同时样本数据跨越两年时间, 未完全在同一时间截面上, 使得模型存在缺陷。

(3) 采用美国市场的房价数据集, 由于市场环境的不同等多种因素使得模型在运用于中国房屋价格的评估上可能存在偏差。

7 结 语

本研究基于HEDONIC理论, 尝试利用不同类型特征构建商品房价格评估模型, 从而为房屋价格评估提供一个效率更高、成本更低、准确性更高的解决方案。并利用西雅图房屋数据进行验证, 构造并选取重要特征, 基于随机森林、KNN、神经网络三种数据挖掘方法构建HEDONIC房屋价格融合预测模型。对西雅图2014年至2015年商品房价格评估的结果分析得出, 该模型明显优于线性拟合HEDONIC模型, 准确度提升11.20%, 较为可靠。从结果来看, 本文提出的融合模型是一种较为可靠的房屋价格评估模型。

未来可在以下方面进行改进:

(1) 尝试进行更精细的参数调节, 并应结合相关研究减少调参的工作量。

(2) 对国内房价估计数据集的建模, 发掘中国与美国房屋在价格组成上的不同, 以提升对国内房屋批量评估的准确性。

(3) 利用其他算法进行模型融合过程构建, 使得最终模型能够充分吸收子模型的优点, 整个评估结果更加科学化、标准化。

作者贡献声明

陈万成: 构建论文思路及框架, 神经网络数据挖掘模型的建立、融合模型生成和数据分析, 论文撰写、修订;

戴浩然: 文献调研, 数据采集以及数据预处理, 随机森林及KNN数据挖掘模型的建立, 论文框架构建和论文撰写;

金映含: 文献调研, 数据采集, 数据校对以及数据预处理, 对回归结果的数据分析, 论文框架的构建和论文撰写。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

[1] 陈万成, 戴浩然, 金映含. Bogs.zip. 西雅图沼泽数据.

[2] 陈万成, 戴浩然, 金映含. Geo_export.zip. 西雅图区域底图数据.

[3] 陈万成, 戴浩然, 金映含. Kc_house.csv. 西雅图房屋价格销售记录.

[4] 陈万成, 戴浩然, 金映含. Landfill.zip. 西雅图垃圾填埋场信息.

[5] 陈万成, 戴浩然, 金映含. Light_Rail_Map.csv. 西雅图轻轨站点数据

[6] 陈万成, 戴浩然, 金映含. Private_school.zip. 西雅图私立学校数据.

[7] 陈万成, 戴浩然, 金映含. Public_school.zip. 西雅图公立学校数据.

[8] 陈万成, 戴浩然, 金映含. Robbery.csv. 西雅图抢劫数据.

[9] 陈万成, 戴浩然, 金映含. Seattle_Police_Department_911_ Incident_Response.csv. 西雅图出警数据.

[10] 陈万成, 戴浩然, 金映含. Wetlands.zip. 西雅图公立学校数据.

参考文献

[1] Carbone R, Longini R L.A Feedback Model for Automated Real Estate Assessment[J]. Management Science, 1977, 24(3): 241-248.
DOI:10.1287/mnsc.24.3.241      URL     [本文引用:1]
[2] Gloudemans R J.Comparison of Three Residential Regression Models: Additive, Multiplicative, and Nonlinear[J]. Assessment Journal, 2002, 9(4): 25-36.
[本文引用:1]
[3] Waugh F V.Quality Factors Influencing Vegetable Prices[J]. Journal of Farm Economics, 1928, 10(2): 185-196.
DOI:10.2307/1230278      URL     [本文引用:1]
[4] Ridker R G, Henning J A.The Determinants of Residential Property Values with Special Reference to Air Pollution[J]. Review of Economics & Statistics, 1967, 49(2): 246-257.
[本文引用:1]
[5] Lancaster K J.A New Approach to Consumer Theory[J]. Journal of Political Economy, 1967, 74(2): 132-157.
[本文引用:1]
[6] Rosen S.Hedonic Prices and Implicit Markets: Product Differentiation in Pure Competition[J]. Journal of Political Economy, 1974, 82(1): 34-55.
DOI:10.1086/260169      URL     [本文引用:1]
[7] Chambers D N.The Racial Housing Price Differential and Racially Transitional Neighborhoods[J]. Journal of Urban Economics, 1992, 32(2): 214-232.
DOI:10.1016/0094-1190(92)90006-7      URL     [本文引用:1]
[8] Chica-Olmo J.Prediction of Housing Location Price by a Multivariate Spatial Method: Cokriging[J]. Journal of Real Estate Research, 2007, 29(1): 95-114.
[本文引用:1]
[9] Wheeler D C, Páez A, Spinney J, et al.A Bayesian Approach to Hedonic Price Analysis[J]. Papers in Regional Science, 2013, 93(3): 663-683.
[本文引用:1]
[10] Ceccato V, Wilhelmsson M.The Impactof Crimeon Apartment Prices: Evidencefrom Stockholm, Sweden[J]. GeografiskaAnnaler, 2011, 93(1): 81-103.
[本文引用:1]
[11] Cohen J P, Cromley R G, Banach K T.Are Homes Near Water Bodies and Wetlands Worth More or Less? An Analysis of Housing Prices in One Connecticut Town[J]. Growth & Change, 2015, 46(1): 114-132.
[本文引用:1]
[12] 张维阳, 李慧, 段学军. 城市轨道交通对住宅价格的影响研究——以北京市地铁一号线为例[J]. 经济地理, 2012, 32(2): 46-51.
通过构造修正后的衰减模型,运用局域空间自相关分析和克里格空间插值的方法,借助GIS空间分析的工具,选择路线长、沿途区位特征分异显著、对房价影响成熟的北京市地铁一号线为例,论证房价与距地铁站距离的相关关系,研究地铁站对房价影响的波及范围及影响程度。研究发现:一号线带状区域在局域范围内具有较强的空间自相关,自相关指数高值点并没有表现出明显的邻近地铁站点分布的特征,而是呈组团状聚集在四个区域。局域自相关性和距地铁站距离存在较弱的负相关关系。轨道交通对郊区住宅价格的影响要高于中心区域,且影响范围较广。地铁站点对住宅价格的影响并不是简单的圈层衰减,而是与特定的区位要素和其他条件综合作用的结果,在典型的地铁站点呈裙状或环状影响。各地铁站点对住宅价格的影响范围从0.5km到1km不等,衰减比重为20%—35%,且在影响范围内衰减程度逐渐降低。
URL     [本文引用:1]
(Zhang Weiyang, Li Hui, Duan Xuejun.The Impacts of Rail Transit on Property Values——The Case of No.1 Line in Beijing[J]. Economic Geography, 2012, 32(2): 46-51.)
[13] NOAA Satellites and Information. Mean Number of Days with Precipitation 0.01 Inch or More[EB/OL]. [2018-02-27]. .
URL     [本文引用:1]
[14] United States Census Bureau.2014. Community Facts [DB/OL]. [2018-02-27]. .
URL     [本文引用:1]
[15] Data USA.SEATTLE, WA[EB/OL]. [2018-02-27]..
URL     [本文引用:1]
[16] Federal Bureau of Investigation. The FBI Releases 2015 Crime Statistics for Washington State [R]. [2018-02-27]. .
URL     [本文引用:1]
[17] 郑佳. 基于HEDONIC的商品住宅批量评估研究 [D]. 哈尔滨: 哈尔滨工业大学, 2014.
[本文引用:1]
(Zheng Jia.Research on Hedonic Model in the Mass Appraisal of Commercial Housing [D]. Harbin:Harbin Institute of Technology,2014.)
[18] Perry C.The Neighborhood Unit[M]. Thoemmes Press, 1998.
[本文引用:1]
资源
PDF下载数    
RichHTML 浏览数    
摘要点击数    

分享
导出

相关文章:
关键词(key words)
房价评估
HEDONIC模型
随机森林
神经网络
KNN

House Price Evaluation
HEDONIC Model
Random Forest
Neural Network
KNN

作者
陈万成
戴浩然
金映含

Chen Wancheng
Dai Haoran
Jin Yinghan