新西兰天维网社区

标题: 中位价定义本身就不科学，建议改算法 [打印本页]

作者: vane 时间: 2015-12-11 10:27:59 标题: 中位价定义本身就不科学，建议改算法

这个中位价定义本身就不科学，采样率太少了。这个数据没什么意义。比如一个非常烂的区，这个时间段内只卖出一套200万的房子，你就说这个区中位数已经到200万了，是不是一个笑话呢？

我觉得用成交价与CV的涨幅乘以这个区的平均CV价，这个数据也许更有用一些。

作者: NewLynnHse 时间: 2015-12-11 10:38:44

其实根本不用分析，分析了又怎样？

作者: vane 时间: 2015-12-11 10:45:04

NewLynnHse 发表于 2015-12-11 10:38
其实根本不用分析，分析了又怎样？

可以看这个区的房价平均值呗，做个参考。

作者: cgc0328 时间: 2015-12-11 10:56:08

不管用什么算法, 采样率低了都毛用没用

作者: vane 时间: 2015-12-11 11:05:02

和CV的差价百分比作为系数受采样率的影响就会小非常多了。（肯定还是有影响）

作者: NewLynnHse 时间: 2015-12-11 11:29:44

vane 发表于 2015-12-11 11:45
可以看这个区的房价平均值呗，做个参考。

个人感觉没有什么参考价值。一条街上的房子都可以差个10W，每套房子的条件不一样。看了数据分析只会让自己更纠结

作者: love_3_month 时间: 2015-12-11 11:36:38

这都是假设各种房子都有充足交易量的前提下做的分析，对大部分街区都有效。。。。

作者: love_3_month 时间: 2015-12-11 11:37:06

参考价值肯定有，但也就是参考。。。。

作者: take-away 时间: 2015-12-11 13:15:59

统计学的很多东西就是在一定的置信区间发生的概率而已，更多是相对性，没有绝对性。

作者: tong1jie 时间: 2015-12-13 12:51:03

vane 发表于 2015-12-11 11:45
可以看这个区的房价平均值呗，做个参考。

比如一个非常烂的区，这个时间段内只卖出一套200万的房子，那么这个区的平均价也是200W!!!

作者: vane 时间: 2015-12-14 16:09:03

tong1jie 发表于 2015-12-13 12:51
比如一个非常烂的区，这个时间段内只卖出一套200万的房子，那么这个区的平均价也是200W!!! ...

你压根就没看懂我说的，打回去仔细看看吧。

作者: Venox10111 时间: 2015-12-14 18:03:01

恩，知道你意思，我正在改qv的算法，现在其实太少就直接屏蔽的

作者: take-away 时间: 2015-12-14 19:08:58

样本少，置信区间自然就大了

作者: vane 时间: 2015-12-15 08:44:45

Venox10111 发表于 2015-12-14 18:03
恩，知道你意思，我正在改qv的算法，现在其实太少就直接屏蔽的

羊大师，没说你没看懂。我说的时哪个TONG1JIE。

作者: 我行我素我酷 时间: 2015-12-15 14:50:58

本帖最后由我行我素我酷于 2015-12-15 15:53 编辑

如果中值，不准确的话，那平均值就更不行了。而且你说一个时间只卖一套高位的，本身这个假设就几乎不可能的事情。就算你的假设成立，按照你的新算法，成交价与CV的涨幅乘以这个区的平均CV价，假如这个烂区ｃｖ平均５０万，这个房子高于ｃｖ　５０％卖出，成交价２００万，那是１７５万，跟你的结果也差不了太多。如果ｃｖ２倍卖出，那就是２２５万，　ｂｒｅａｋｅｖｅｎ，是ｃｖ７５％涨幅，也就是说，假如你的２００万高于ｃｖ２倍以上卖出，可能会更高。那岂不是更是笑话，假设如果不全面，就算方法再好，基本也是没用。任何数据，拿出来小概率事件计算基本都啥可分析性，所以现在比较准确现在都是大数据分析，所有数据都概括里面，目前也是很容易实现的。

作者: vane 时间: 2015-12-15 15:07:14

本帖最后由 vane 于 2015-12-16 09:05 编辑

我行我素我酷发表于 2015-12-15 14:50
如果中值，不准确的话，那平均值就更不行了。而且你说一个时间只卖一套高位的，本身这个假设就几乎不可能 ...

看着你举的例子算法乱七八糟的。来，我给你详解一下我的算法：

用你的例子，一个“烂区”cv平均50万，3个月成交的房子平均超cv50%。那么这个cv平均参考房价是50*(1+0.5)=75万。那么这个“烂区”，就不算百万豪宅区。你说75万这个数据有什么可笑的？

这个算法妙就妙在只取用了样本的百分比的数据而不是绝对成交价数据，这样可以大大降低了样本少的不可靠性。而且，这个算法既考虑了房子本身的价值（cv平均50万），又考虑了当前市场价格（平均超cv50%），这个数据应该是比较科学的。
这样说你明白了吧？

作者: vane 时间: 2015-12-16 12:17:49

看样子没看懂的人还挺多啊。

作者: 紫鹤 时间: 2015-12-16 13:56:00

统计学大讨论？？

欢迎光临新西兰天维网社区 (http://bbs.skykiwi.com/)