Hace algunos meses quería probar glusterfs en algunos servicios que no tienen un NFS o un storage compartido, por lo cual había decidido crear un híbrido de sincronización con torrent.

Sin embargo, hace pocos días comencé a experimentar con GlusterFS, en especial cuando SyncThing comenzó a ocupar bastante CPU en relación a la cantidad de datos sincronizados (25% en relación a 1,99 GB).

En pocas palabras, GlusterFS es un sistema de archivos descentralizados cuya función es crear una especie de array de discos virtuales pero en máquinas distribuidas. (Vaya explicación). En español más claro: es un sistema de archivos que puede replicar datos a lo largo de diversos servidores sin la necesidad de montarlos como unidades NFS, sino que por medio de una conexión va enviando archivos al resto de los nodos de réplica que se encuentren en el pool de servidores.

He montado una pequeña suerte de cluster con PHP-FPM, Nginx como balanceador de carga y GlusterFS con réplica 2 para sincronizar los cambios, además de dejar como acceso a NFS en el servidor de balanceo de carga, y ha funcionado bastante bien, en especial cuando ejecuto ab para probar la carga, donde el percentil 95% cargó una página simple, en promedio, a 500 ms (concurrencia 256, 100k peticiones), por lo cual me deja algo tranquilo para seguir experiementado con esto.