Convertidor de PDF a Excel
Convierte el texto de tu PDF en una hoja de cálculo de Excel que puedes abrir en Microsoft Excel, Google Sheets o LibreOffice Calc. Cada línea de la página se convierte en una fila y las columnas se separan donde hay un espacio claro entre los valores. Los PDF escaneados, solo de imagen, se reconocen primero con OCR integrado, así que incluso los estados de cuenta e informes fotografiados pueden pasar a una hoja de cálculo, todo sin subir tu archivo a ningún sitio.
¿Qué hace esta herramienta?
El convertidor de PDF a Excel lee el contenido de texto de un PDF y escribe un libro .xlsx nativo. Para los PDF que ya contienen texto, extrae las palabras y sus posiciones directamente; para los escaneos solo de imagen, ejecuta el reconocimiento óptico de caracteres en tu navegador antes de crear la hoja. Cada línea reconocida se coloca en su propia fila, y los espacios horizontales amplios entre palabras se interpretan como saltos de columna para que los diseños tabulares caigan en celdas separadas. El resultado es una hoja de cálculo estándar Office Open XML, no una imagen de una tabla, por lo que las celdas son reales, seleccionables y editables.
Cómo funciona
La herramienta rasteriza las páginas escaneadas y reconoce su texto con un motor LSTM de Tesseract, o extrae el texto incrustado directamente de los PDF basados en texto. Las palabras reconocidas tienen posiciones en píxeles, que se agrupan en líneas visuales por alineación vertical y se ordenan de izquierda a derecha. Dentro de cada línea se mide el espacio entre palabras: un hueco notablemente más ancho que el espacio normal entre palabras se trata como un límite de columna, dividiendo la línea en varias celdas. Esas filas y celdas se serializan en el XML de la hoja y se comprimen en un archivo .xlsx válido usando el estándar Office Open XML, listo para abrir en cualquier aplicación de hojas de cálculo.
Características
- Genera un libro .xlsx real (se abre en Excel, Google Sheets, LibreOffice Calc)
- OCR automático para PDF escaneados, solo de imagen
- Cada línea de la página se convierte en una fila de la hoja
- División de columnas con el mejor esfuerzo según los espacios amplios entre valores
- Fila en blanco opcional entre páginas
- 100% en el navegador — tu archivo nunca sale de tu dispositivo
- Formato estándar Office Open XML
Cómo usar
- 1
Sube tu PDF
Arrastra cualquier PDF a la zona de carga. Los PDF basados en texto se leen directamente; las páginas escaneadas o fotografiadas se detectan y procesan con OCR automáticamente.
- 2
Elige el manejo de columnas
Mantén activada la división de columnas para separar cada línea en celdas en los huecos amplios, o desactívala para poner cada línea completa en una sola columna. Opcionalmente añade una fila en blanco entre páginas.
- 3
Convierte a Excel
Haz clic en Convertir a Excel. El texto se extrae (con OCR cuando es necesario) y se organiza en filas y celdas en un libro .xlsx nativo.
- 4
Abre en tu aplicación de hojas de cálculo
Descarga el archivo .xlsx y ábrelo en Microsoft Excel, Google Sheets o LibreOffice Calc. Ajusta las columnas y limpia las celdas según sea necesario.
Casos de uso comunes
Estados de cuenta en una hoja
Extrae las líneas de transacciones de un PDF de estado de cuenta a filas de Excel para ordenarlas, sumarlas y categorizarlas en lugar de reescribirlas a mano.
Informes y facturas
Extrae partidas y cifras de informes o facturas en PDF a una hoja de cálculo para realizar más cálculos y análisis.
Tablas escaneadas
Reconoce el texto de páginas escaneadas o fotografiadas y colócalo en una hoja de cálculo, con columnas separadas donde el original tenía espacios claros.
Reutilización de datos
Saca el contenido tabular de PDF de solo lectura a un formato que puedas filtrar, graficar y compartir con fórmulas.
Consejos y buenas prácticas
- La división de columnas es una heurística con el mejor esfuerzo basada en los espacios, no una detección real de tablas — revisa y ajusta las columnas después de abrir el archivo
- Las columnas numéricas muy juntas o las celdas combinadas pueden desalinearse, ya que no siempre hay espacios claros — es normal algo de limpieza manual
- En los PDF escaneados, los escaneos de mayor calidad producen un OCR más preciso y columnas más limpias
- Desactiva la división de columnas cuando solo quieras cada línea como una sola celda para su posterior procesamiento