java geo distance 计算踩坑实录：从Haversine到Geohash，老鸟教你避坑-山东电子政务网

做地图定位这行十年了，真没少跟经纬度较劲。刚入行那会儿，觉得算个两点距离还不是手到擒来？写个公式，导入包，完事。直到有一次大促，服务器CPU直接飙到100%，运维大哥差点把我工位给砸了。那一刻我才明白，地理空间计算这事儿，看着简单，水深得能淹死人。

今天咱不整那些虚头巴脑的理论，就聊聊在实际业务里，怎么优雅又高效地搞定 java geo distance 计算。很多新手一上来就搞 Haversine 公式，或者更狠的，直接调数据库的 ST_Distance。这都没错，但得看场景。

记得去年给一个同城配送平台做重构，他们原本的做法是，每次用户下单，都去数据库里全表扫描，把附近5公里内的商家全捞出来，然后在Java层一个个算距离。好家伙，数据量上万条的时候，查询耗时直接破秒。老板脸都绿了。

咱们得换个思路。首先，得承认地球是个椭球体，不是个正圆。如果你只是做个大概的筛选，比如“附近的人”，用简单的欧几里得距离或者粗略的 Haversine 近似值，速度那是真快。但如果涉及到计费、路径规划，那精度必须得够。这时候，java geo distance 的精度问题就凸显出来了。

我当时的解决方案是分两步走。第一步，用 Geohash 或者 S2 Geometry 做粗筛。把经纬度编码成字符串，比如前5位相同，基本就在1公里以内。这步操作在内存里就能跑，比查数据库快了几个数量级。第二步，对粗筛出来的候选集，再用高精度的算法算实际距离。

这里有个坑，很多人喜欢用 Java 自带的 Math 库自己算。说实话，除非你是搞科研的，否则别这么干。推荐用 JTS Topology Suite 或者 GeoTools。这俩库虽然重了点，但人家处理各种边界情况、坐标系转换，那是真专业。我有个同事，非要用自己写的三角函数算，结果在极地附近算出了负距离，差点没把他气死。

再说说数据库层面。如果你用的是 MySQL 5.7+ 或者 PostgreSQL (PostGIS)，那真是省事了。PostGIS 的地理空间索引（GiST）简直是神器。把经纬度存成 geometry 类型，建个索引，查询速度飞起。但要注意，别在索引列上做函数运算，不然索引就废了。比如，别写 WHERE ST_Distance(geom, point) < 5，而要写 WHERE geom && ST_Buffer(point, 5)，先框选再精确算。

还有个小细节，坐标系的统一。国内一般用 GCJ-02（火星坐标），国外用 WGS84。如果你拿 WGS84 的坐标去算 GCJ-02 的距离，那偏差能有好几百米。做跨境业务或者地图类APP，这个坑必须得填。我见过一个项目，因为没做坐标转换，用户明明在楼下，导航却把人导到了隔壁省，差评如潮。

最后，关于性能优化。如果数据量特别大，比如亿级轨迹数据，建议引入 Elasticsearch 的 geo_distance 查询，或者专门的数据仓库如 ClickHouse。别什么都往 MySQL 里塞，那是对数据库的折磨。

总之，做 java geo distance 相关开发，核心就两点：一是选对算法，二是用对索引。别为了炫技搞复杂算法，简单有效才是王道。希望这些踩坑经验，能帮你在接下来的项目中少加几次班。毕竟，代码写得再漂亮，跑起来慢，那也是白搭。咱们做技术的，最终还得看结果说话。