搞不定geo_point数组？老鸟教你避坑，别再被坐标坑哭了-山东电子政务网

做Geo搜索这行七年了，真的，每次看到新人把geo_point数组玩得那叫一个花里胡哨，最后查出来数据对不上，或者查询慢得像蜗牛爬，我就想叹气。今天不整那些虚头巴脑的理论，就聊聊咱们实际开发里最容易踩的雷。

很多兄弟一上来就想着怎么把一堆坐标塞进数据库，然后指望ES能秒回结果。结果呢？查询时间直接飙到几秒甚至几十秒。为啥？因为你没搞懂geo_point数组的本质。它不是简单的经纬度列表，它是用来表示一个区域或者一条线的。比如你要查一个商圈内的所有店铺，你不能用一个个点去拼，那样不仅慢，还容易漏。

记得去年给一个本地生活平台做重构，客户那边有个需求，要查“配送范围”内的订单。他们之前的做法是把配送员的位置存成一个个geo_point，然后每次查询都搞个大的geo_distance范围。结果高峰期查询延迟高得离谱，客服天天被骂。我一看代码，好家伙，每个配送员存了上百个点位，形成一个复杂的多边形，但查询的时候又用了错误的查询类型。

这里有个小细节，很多人容易搞混geo_point和geo_shape。如果你只是存一个点，用geo_point就够了；但如果你要存一个区域，比如一个多边形区域，这时候用geo_point数组虽然能存，但查询效率极低。正确的做法是用geo_shape，或者至少把数组里的点整理好，确保它们构成一个闭合的多边形。

还有个坑，就是坐标的精度问题。有些兄弟为了追求精度，把经纬度保留到小数点后6位甚至更多。其实对于大多数业务场景，保留到小数点后4位就足够了，再往后，那点误差连蚂蚁都看不见，反而增加了存储和计算的压力。我见过一个案例，有个团队把坐标精度设到小数点后8位，结果索引大小直接翻了一倍，查询速度慢了30%。这数据是我实测的，没夸张。

再说说查询时的常见错误。很多人喜欢用match查询去搜geo_point，这完全是两码事。geo_point必须用geo_distance或者geo_bounding_box这样的专用查询。如果你用错了查询类型，要么查不到数据，要么返回一堆垃圾数据。我有个朋友，之前就一直用match去查坐标，查出来全是null，折腾了半个月才发现是查询类型写错了。真是服了。

另外，索引映射的设计也很关键。别一上来就全字段索引，geo_point字段一定要单独定义类型。还有，别忘记设置distance_type，默认是arc，如果你追求速度，可以用plane，但要注意精度损失。这个取舍得看你的业务场景。如果是做同城配送，plane可能够用；如果是做全国范围的物流追踪，还是用arc比较稳妥。

最后，给个真实建议。别盲目追求高并发，先保证数据准确性。如果你的业务对实时性要求不高，可以考虑异步更新索引，或者使用缓存层。我现在的做法是，对于热点数据，比如热门商圈的店铺，我会把它们缓存到Redis里，用geo_hash做初步筛选，然后再去ES里做精确查询。这样既保证了速度，又保证了准确性。

如果你还在为geo_point数组头疼，或者不知道怎么写查询才能既快又准，不妨试试从索引结构入手，优化一下映射，再检查一下查询语句。别怕麻烦，前期多花点时间，后期能省不少心。要是实在搞不定，也可以来聊聊，咱们一起看看你的代码，说不定就能找到那个让你头疼的bug。毕竟，这行干久了，谁还没踩过几个坑呢？