en 24 meses de

EnvĂ­o gratis a todo el paĂ­s

Conoce los tiempos y las formas de envĂ­o.

¡Última disponible!

MercadoLĂ­der Gold

¡Uno de los mejores del sitio!

+5mil

Ventas concretadas

Brinda buena atenciĂłn

Entrega sus productos a tiempo

Medios de pago

Meses sin Tarjeta

Mercado Crédito

Tarjetas de crédito

¡Paga en hasta 3 cuotas!

Mastercard
American Express
Visa

Tarjetas de débito

Visa Débito
Si Vale
Si Vale
Tengo
Edenred
Mastercard Débito

Efectivo

PayCash
OXXO

CaracterĂ­sticas del producto

CaracterĂ­sticas principales

TĂ­tulo del libro
DESARROLLO DE MOTORES DE BUSQUEDA UTILIZANDO HERRAMIENTAS OPEN SOURCE
Autor
Ortega Candel, José Manuel
Idioma
Español
Editorial del libro
Alfaomega Grupo Editor
EdiciĂłn del libro
1
Tapa del libro
Blanda
Año de publicación
2022
Marca
ALFAOMEGA GRUPO EDITOR

Otros

Altura
25 cm
Ancho
20 cm
Peso
764 g
Género del libro
Literatura y ficciĂłn
ISBN
9786075388571

DescripciĂłn

El desarrollo de motores de búsqueda ha crecido en los últimos años gracias al uso de herramientas y frameworks open source, pues facilitan una base sobre la cual realizar nuestras aplicaciones orientadas a la extracción y búsqueda de diferentes fuentes de datos.

Si desea adquirir los conocimientos necesarios para dominar las principales herramientas open source, las librerías y los frameworks, ha llegado al libro indicado. Este manual le proporciona, desde un enfoque teórico-práctico, todos los conceptos e instrucciones que le permitirán construir desde cero motores de búsqueda utilizando los lenguajes de programación Java y Python.

Gracias a los contenidos del libro:

Conocerá la estructura y naturaleza de un motor de búsqueda, así como la importancia de los sistemas de búsqueda y recuperación de la información.

Aprenderá los principales motores de búsqueda open source y su funcionamiento interno.

Dominará las diferentes herramientas para desarrollar motores de búsqueda utilizando frameworks de desarrollo dentro de los ecosistemas de programación Java y Python.

Además, con el objetivo de obtener el máximo provecho de las herramientas y facilitar el seguimiento de las prácticas del libro, en la primera página se proporciona el acceso al repositorio con el código de los ejemplos desarrollados.

Hágase con el libro y descubra las principales herramientas que todo desarrollador e ingeniero de software debe dominar para desarrollar sus propios motores de búsqueda.

INTRODUCCIÓN. 1
CAPĂŤTULO 1
INTRODUCCIÓN A LOS MOTORES DE BÚSQUEDA 3
1.1 DefiniciĂłn de motores de bĂşsqueda.. 4
1.2 ¿Por qué necesito un motor de búsqueda? 5
1.2.1 ExtracciĂłn de texto en documentos. 5
1.2.2 Operaciones de lectura. 6
1.2.3 Esquema flexible 6
1.3 Funcionamiento de un motor de bĂşsqueda.. 7
1.3.1 Buscadores de directorios 8
1.3.2 Buscadores jerárquicos.. 8
1.3.3 Spiders (arañas o crawlers) 8
1.4 Proceso de indexaciĂłn. 10
1.4.1 Rendimiento en la indexaciĂłn de documentos 10
1.4.2 Stopwords.. 11
1.4.3 Steamming. 11
1.5 RecuperaciĂłn de la informaciĂłn 12
1.5.1 ExtracciĂłn de informaciĂłn. 14
1.5.2 Sistema de bĂşsqueda/respuesta.. 15
1.6 Motores de bĂşsqueda e indexadores. 15
1.6.1 Lucene.. 17
1.6.2 ĂŤndice invertido. 19
1.6.3 Apache Solr 19
1.6.4 ElasticSearch 19
1.6.5 Otros motores de bĂşsqueda 20
1.7 Herramientas de procesamiento de lenguaje natural (PLN)21 CAPĂŤTULO 2
APACHE LUCENE.. 25
2.1 IntroducciĂłn a Apache Lucene.. 25
2.2 MĂłdulos y funcionalidades de Apache Lucene.. 28
2.3 Arquitectura de Apache Lucene 31
2.3.1 Proceso de tokenizaciĂłn y bĂşsqueda en Apache Lucene 34
2.4 Trabajar con Apache Lucene. 36
2.4.1 ConfiguraciĂłn del entorno. 36
2.4.2 Crear un Ă­ndice 40
2.4.3 Crear y escribir documentos en un Ă­ndice.. 43
2.5 Realizar bĂşsquedas en Apache Lucene. 47
2.5.1 ObtenciĂłn de un IndexSearcher. 47
2.5.2 Proceso de bĂşsqueda con IndexSearcher.. 48
2.5.3 Crear consultas con Lucene QueryParser. 49
2.5.4 Sintaxis de las consultas en Apache Lucene.. 53
2.6 BĂşsqueda de informaciĂłn con Apache Lucene.. 55
2.7 BĂşsqueda en mĂşltiples Ă­ndices de Lucene. 58
2.8 Herramientas de administraciĂłn de Lucene 60
2.9 Herramientas de bĂşsqueda que usan Apache Lucene 61
2.9.1 Krugle 61
2.9.2 Google Dataset Search 62
2.9.3 Otros repositorios y portales. 63
CAPĂŤTULO 3
APACHE SOLR 65
3.1 IntroducciĂłn a Apache Solr.. 65
3.2 Arquitectura de Apache Solr 67
3.3 IndexaciĂłn e Ă­ndice invertido en Apache Solr. 69
3.3.1 Relevancia y filtro en las bĂşsquedas 69
3.4 InstalaciĂłn de Solr.. 70
3.5 Configurar Apache Solr.. 75
3.5.1 Ficheros de configuraciĂłn y esquema. 77
3.5.2 Proceso de indexaciĂłn 82
3.5.3 IndexaciĂłn de datos con SimplePostTool. 84 3.5.4 Esquema administrado en Apache Solr. 88
3.5.5 Añadir información al índice 90
3.6 BĂşsqueda de documentos. 92
3.6.1 Usar la API REST 94
3.6.2 Consultas básicas de Solr. 97
3.6.3 Componente stats (estadĂ­sticas) 102
3.7 Consultas avanzadas de Solr 103
3.7.1 PaginaciĂłn y clasificaciĂłn 103
3.7.2 NavegaciĂłn facetada en Solr.. 105
3.7.3 BĂşsqueda de facetas en Solr.. 109
3.8 Componentes de una peticiĂłn en Solr. 114
3.8.1 Controladores Request Handler. 114
3.9 Analizadores en Apache Solr.. 116
3.9.1 Definir campos personalizados 117
3.9.2 ConfiguraciĂłn de los tipos de campos 120
3.9.3 Propiedad score.. 123
3.10 MonitorizaciĂłn del rendimiento de Apache Solr.. 124
3.10.1 Página de plugins/estadísticas de Apache Solr.. 124
3.11 EjecuciĂłn en modo Cloud.. 127
3.11.1 TerminologĂ­a usada en SolrCloud 128
3.11.2 SolrCloud. 130
3.11.3 Ejecutar SolrCloud. 130
3.11.4 IndexaciĂłn distribuida 131
3.11.5 Ventajas de SolrCloud. 133
3.12 Arrancar Apache Solr desde Docker134
3.13 Interactuar con Solr desde Java.. 137
3.13.1 Añadir Solrj a un proyecto Maven.. 138
3.13.2 ConexiĂłn con el servidor Solr desde Java.. 140
3.14 Crawling con Apache Nutch y conexiĂłn con Apache Solr.. 147
3.15 Conclusiones de Apache Solr152
CAPĂŤTULO 4
ELASTICSEARCH.. 155
4.1 IntroducciĂłn a ElasticSearch. 155
4.1.1 Ventajas de ElasticSearch sobre Apache Solr. 159 4.2 Uso de ElasticSearch para proyectos de Big Data.. 159
4.3 Arquitectura de ElasticSearch 160
4.3.1 Nodos en ElasticSearch. 163
4.4 ElasticSearch como soluciĂłn distribuida. 164
4.5 Fragmentos y réplicas en ElasticSearch 166
4.6 InstalaciĂłn de ElasticSearch. 170
4.7 Crear un Ă­ndice en ElasticSearch. 174
4.8 API REST de ElasticSearch. 176
4.8.1 Mapping o estructura de los datos del Ă­ndice 184
4.8.2 Recuperar parte de un documento 187
4.8.3 Asignar un mapeo a un Ă­ndice. 188
4.8.4 Query DSL (solicitudes DSL). 191
4.8.5 BĂşsquedas en ElasticSearch.. 196
4.8.6 La consulta multi_match. 206
4.8.7 NavegaciĂłn facetada en ElasticSearch 208
4.8.8 Agregaciones en documentos.. 209
4.8.9 Autocompletado en ElasticSearch. 210
4.8.10 Analizadores en ElasticSearch.. 214
4.9 Relevancia de documentos en ElasticSearch 216
4.9.1 PuntuaciĂłn y relevancia de los documentos.. 216
4.9.2 Mejorar la relevancia de los resultados de bĂşsqueda 219
4.10 EstadĂ­sticas e informaciĂłn sobre el clĂşster, Ă­ndices y nodos 222
4.10.1 Estado del clĂşster.. 222
4.10.2 Métricas del clúster.. 225
4.10.3 EstadĂ­sticas de los Ă­ndices 226
4.11 Herramientas de monitorizaciĂłn en ElasticSearch. 228
4.11.1 ElasticSearch Head 229
4.11.2 ElasticSearch query client 233
4.11.3 Cerebro.. 235
CAPĂŤTULO 5
CLIENTES ELASTICSEARCH.. 239
5.1 Clientes de conexiĂłn en Java. 239
5.2 ConexiĂłn al clĂşster de ElasticSearch. 242 5.3 Gestionar Ă­ndices. 244
5.4 IndexaciĂłn de documentos en el Ă­ndice. 246
5.5 BĂşsqueda de documentos en el Ă­ndice. 247
5.6 IntegraciĂłn con Spring Data. 252
5.7 Seguridad en ElasticSearch 287
5.8 Conclusiones de ElasticSearch.. 293
CAPĂŤTULO 6
VISUALIZACIÓN DE DATOS CON KIBANA. 295
6.1 IntroducciĂłn a Kibana 295
6.2 Stack ELK.. 297
6.2.1 Principales usos de ELK 298
6.2.2 Stack ELK en contenedores Docker.. 298
6.3 InstalaciĂłn de Kibana.. 301
6.4 LogStash.. 308
6.4.1 InstalaciĂłn de LogStash 309
6.4.2 ConfiguraciĂłn de LogStash. 310
6.4.3 Otros servicios de Elastic. 317
6.5 MonitorizaciĂłn de LogStash desde Kibana 318
6.6 Seguridad en Kibana. 321
CAPĂŤTULO 7
MOTORES DE BĂšSQUEDA CON PYTHON.. 325
7.1 Conectando con Solr desde Python 325
7.2 IntegraciĂłn de ElasticSearch con Python 327
7.2.1 Crear un Ă­ndice e insertar documentos usando Python. 329
7.2.2 Realizar bĂşsquedas usando Python.. 331
7.3 Consultar ElasticSearch a través de la API RESTen Python 341
7.4 Optimizar un Ă­ndice en ElasticSearch.. 350
7.5 Indexar documentaciĂłn de Django 351
7.6 Whoosh como motor de bĂşsqueda en Python 359
7.6.1 Whoosh schema. 360
7.6.2 Realizar bĂşsquedas en Whoosh y scoring. 362 7.7 Django-haystack 365
7.7.1 Integrar haystack en una aplicaciĂłn Django.. 366
CAPĂŤTULO 8
GLOSARIO DE TÉRMINOS 371

Libro en stock permanente en Editorial, aunque agradecemos lo consulte con un mensaje. ya que contamos con existencia limitada.
Atte.
Centro Librero
"Amor a los Libros"

Nota: Todos los libros que manejamos son fisicos

Preguntas y respuestas

¿Qué quieres saber?

PregĂşntale al vendedor

Nadie ha hecho preguntas todavĂ­a.

¡Haz la primera!