Zoom Logo

Indexación de Google Académico para Repositorios DSpace - Shared screen with speaker view
César Augusto Olivares Poggi
20:24
¡Gracias por estar con nosotros! Mi nombre es Mónica Westin y trabajo en Google Académico, en el área de alianzas y difusión. Me complace mucho hablarles a todos ustedes hoy sobre cómo garantizar que su repositorio esté bien indexado en Google Académico. Habrá una buena cantidad de tiempo para preguntas al final. Esperaré un momento para que todos se aseguren de que estén en silencio ... De acuerdo, comencemos.
César Augusto Olivares Poggi
20:45
La parte informativa de este seminario web durará alrededor de 30 minutos. Comenzaré con una descripción general de cómo funciona el sistema de indexación de Google Académico y lo que se necesita para ser incluidos.
César Augusto Olivares Poggi
21:08
A partir de ahí, describiré los problemas comunes de indexación del repositorio y cómo identificarlos y solucionarlos.
César Augusto Olivares Poggi
21:10
Les mostraré cómo verificar la cobertura de su repositorio en Google Académico. Finalmente, terminaré con información sobre dónde pueden encontrar más recursos sobre Google Académico y pautas para la solución de problemas. La segunda parte de la charla se dedicará a una sesión de preguntas y respuestas con todos ustedes.
César Augusto Olivares Poggi
21:28
El sistema de indexación de Google Académico funciona mediante la búsqueda de contenido académico, la identificación de metadatos asociados y la agrupación de diferentes versiones de elementos en los resultados de búsqueda.
César Augusto Olivares Poggi
21:35
Para hacer esto, primero, un rastreador explora la web en busca de artículos académicos.
César Augusto Olivares Poggi
21:41
Una vez que se ha identificado un elemento, el sistema busca y analiza los metadatos bibliográficos para este elemento.
César Augusto Olivares Poggi
21:47
El sistema enumera todas las versiones del elemento en los resultados de búsqueda, como se puede ver en el enlace "Las 4 versiones" que he resaltado aquí.
César Augusto Olivares Poggi
22:13
Investigadores de todo el mundo utilizan Google Académico de manera muy amplia, y la inclusión de la colección de su repositorio en los resultados de búsqueda de Google Académico crea una visibilidad global inmediata para estas publicaciones.
César Augusto Olivares Poggi
22:18
Sabemos lo importante que puede ser este beneficio para los autores de su institución. También muestra el importante papel de la biblioteca en la difusión de las investigaciones de su institución.
César Augusto Olivares Poggi
22:31
La imagen aquí muestra un resultado de búsqueda típico de Google Académico para un elemento que es exclusivo de un repositorio.
César Augusto Olivares Poggi
22:39
Tanto el enlace principal para este elemento como lo que llamamos el "enlace de acceso" a la derecha, que va directamente al PDF, apuntan a esta publicación en el repositorio DSpace.
César Augusto Olivares Poggi
22:55
Cuando la versión publicada formalmente de un artículo está disponible en el sitio de un editor, esa versión generalmente aparecerá como el enlace principal.
César Augusto Olivares Poggi
23:08
La versión del repositorio aún puede aparecer como enlace de acceso, especialmente si no hay una versión de acceso abierto en el sitio del editor, como se ve aquí: el enlace de la Cambridge University Press es el enlace principal, y el enlace del repositorio es el enlace de acceso.
César Augusto Olivares Poggi
23:24
Si el repositorio está correctamente indexado, la versión del repositorio estará en el enlace "Las # versiones" que mencioné anteriormente. En la siguiente diapositiva, les mostraré cómo se ve la página "Las 4 versiones" para este artículo.
César Augusto Olivares Poggi
23:33
Esta es la página que aparece cuando hago clic en "Las 4 versiones".
César Augusto Olivares Poggi
23:39
Aquí pueden ver que el primer resultado es la versión del editor, y la versión del repositorio aparece en segundo lugar. Google Académico también indexa citas y registros de agregadores.
César Augusto Olivares Poggi
23:54
Entonces, ¿qué necesita el sistema de indexación de Scholar para encontrar los elementos de su repositorio e incluirlos en los resultados de búsqueda como acabo de mostrar?
César Augusto Olivares Poggi
24:02
Describí anteriormente cómo comienza rastreando la web. Eso significa que necesita acceso para rastrear el sitio de su repositorio para que se puedan encontrar los elementos.
César Augusto Olivares Poggi
24:13
El sistema también necesita saber cuándo se agrega contenido nuevo, lo que generalmente significa la configuración de navegación por fecha o un mapa del sitio con enlaces a URLs de nivel de elemento. Estas dos primeras configuraciones están activadas de forma predeterminada en DSpace.
César Augusto Olivares Poggi
24:20
Finalmente, para identificar los metadatos de las publicaciones que encuentra, el sistema de Google Académico requiere acceso a los metadatos legibles por máquina para estos elementos.
César Augusto Olivares Poggi
24:28
Estos metadatos legibles por máquina utilizados por Google Académico se denominan metaetiquetas, que inician con la palabra "citation” más un guión bajo.
César Augusto Olivares Poggi
24:40
A veces se les llama también "etiquetas de HighWire Press" o "etiquetas de Google Scholar". La imagen de la derecha muestra una conjunto típico de metaetiquetas.
César Augusto Olivares Poggi
24:46
Se ha tomado de nuestras pautas de inclusión, que compartiré más adelante.
César Augusto Olivares Poggi
24:51
Las metaetiquetas en el cuadro verde contienen metadatos bibliográficos usuales, como los nombres de los autores y la fecha de publicación. Estas metaetiquetas también admiten datos de autor ORCID.
César Augusto Olivares Poggi
25:15
Estas metaetiquetas están activadas de forma predeterminada para DSpace y DSpace-CRIS.
César Augusto Olivares Poggi
25:20
Pueden revisar las metaetiquetas de un elemento en su repositorio yendo a la página del elemento, y luego mostrando el código fuente HTML.
César Augusto Olivares Poggi
25:28
Por lo general, puede hacer esto haciendo clic con el botón derecho en la página y seleccionando "Ver código fuente de la página" o usando un comando del teclado, dependiendo del navegador que use.
César Augusto Olivares Poggi
25:37
Una vez que esté en el código fuente HTML, puede buscar todas las instancias de "citation_" para ver la lista de metatags.
César Augusto Olivares Poggi
25:44
Este proceso se puede usar para probar y solucionar muchos de los errores de indexación del repositorio que describiré en esta presentación.
César Augusto Olivares Poggi
25:54
Cuando revise los metatags de un elemento, siempre querrá compararlos con los metadatos en la versión del registro, es decir, por ejemplo, con el PDF o la versión del editor del artículo.
César Augusto Olivares Poggi
26:04
Aquí puede ver la versión del registro encima de las metaetiquetas de la versión de este documento en el repositorio.
César Augusto Olivares Poggi
26:09
Estas metaetiquetas se ven muy bien.
César Augusto Olivares Poggi
26:14
Las fechas de publicación, resaltadas en rojo, coinciden. Los autores están destacados en verde.
César Augusto Olivares Poggi
26:19
Observen que las metaetiquetas del autor están en el mismo que los autores en la versión del registro.
César Augusto Olivares Poggi
26:25
Además, observen que dado que el resumen, destacado en celeste, está escrito en portugués, también lo están los metatags. Voy a entrar en más detalles sobre estas mejores prácticas pronto.
César Augusto Olivares Poggi
26:39
He dedicado mucho tiempo al inicio a las metaetiquetas bibliográficas porque esta es, con mucho, el área más común para errores de repositorio cuando se trata de la indexación en Google Académico.
César Augusto Olivares Poggi
26:52
La indexación en Google Académico requiere metaetiquetas precisas -- y metadatos incorrectos se traducen en autores descontentos y artículos no clasificados como deberían, por falta de citas.
César Augusto Olivares Poggi
26:58
El sistema de indexación detecta automáticamente los sitios con frecuentes errores de metadatos y deja de incluirlos.
César Augusto Olivares Poggi
27:04
Si su repositorio se ha eliminado del índice de Google Académico, podría deberse a errores frecuentes de metadatos.
César Augusto Olivares Poggi
27:11
Hay un par de otras causas para los errores de indexación del repositorio.
César Augusto Olivares Poggi
27:17
Deben evitarse las interrupciones del sitio, y recomiendo que conserven la configuración que DSpace trae predeterminada para el acceso a los rastreadores. Discutiré brevemente esto hacia el final de mi presentación.
César Augusto Olivares Poggi
27:22
Pasaré ahora a los errores comunes de indexación para los repositorios.
César Augusto Olivares Poggi
27:30
La fecha de publicación es una pieza crucial de metadatos para la indexación de artículos académicos.
César Augusto Olivares Poggi
27:37
Otras fechas, como la fecha en que se cargó un documento al repositorio, no deben usarse en su reemplazo si la fecha de publicación no está disponible; es mejor no incluir una metaetiqueta de fecha de publicación que una incorrecta.
César Augusto Olivares Poggi
27:47
Si la fecha de publicación en la metaetiqueta citation_date no coincide con la fecha de publicación en la versión de registro, es una bandera roja para el sistema de indexación.
César Augusto Olivares Poggi
27:54
Aquí puede ver un ejemplo típico, donde la fecha de publicación en la etiqueta de identificación del repositorio es posterior a la fecha de publicación real del elemento.
César Augusto Olivares Poggi
28:05
Esto sugiere que se incluyó accidentalmente como fecha de publicación la fecha en que el PDF estuvo disponible en línea o que se subió al repositorio, que es el tipo más común de error de fecha de publicación.
César Augusto Olivares Poggi
28:25
Para probar si tiene este problema, revisar el código HTML le permitirá ver la etiqueta citation_date para las publicaciones en su repositorio.
César Augusto Olivares Poggi
28:32
Compare esto con las fechas de publicación que figuran en la versión de registro y mire si estas fechas son las mismas.
César Augusto Olivares Poggi
28:42
Si el problema está muy extendido en su repositorio, y parece que la fecha de puesta en línea se da como la fecha de publicación, hay un parche de DSpace que ha sido desarrollado por la comunidad específicamente para solucionar este problema.
César Augusto Olivares Poggi
28:47
Este parche garantizará que solo se use la fecha de publicación en la etiqueta citation_date.
César Augusto Olivares Poggi
28:56
A diferencia de otras metaetiquetas, el orden de las metaetiquetas de autor es importante, ya que controla el orden en que aparecen los autores en los resultados de búsqueda de Google Académico.
César Augusto Olivares Poggi
29:08
La metaetiqueta de autor con el nombre del primer autor de una publicación debe aparecer en el código HTML antes de la metaetiqueta de autor con el nombre del segundo autor, y así sucesivamente.
César Augusto Olivares Poggi
29:15
Aquí pueden ver un ejemplo en el que este orden ha salido mal.
César Augusto Olivares Poggi
29:25
No solo los autores, especialmente el primer autor, estarán descontentos con el orden del autor resultante en los metadatos, sino que, si esto ocurre muchas veces para un repositorio, el sistema de indexación de Scholar se verá forzado a dejar de indexarlo.
César Augusto Olivares Poggi
29:38
Para probar los errores de orden de autor, compare el orden de las metaetiquetas de autor con el orden de los autores en la versión de registro. Si encuentra inconsistencias, hay algunas potenciales soluciones.
César Augusto Olivares Poggi
29:51
Existe un error conocido para las versiones 5.0, 5.1, 5.2 y 5.3 de DSpace que crea un orden de autores incorrecto.
César Augusto Olivares Poggi
29:58
Si está utilizando una de estas versiones, puede aplicar este parche de DSpace para corregir este error, o bien actualizar a la versión 5.4 o posterior de DSpace.
César Augusto Olivares Poggi
30:08
También recomiendo verificar si su repositorio está enumerando a los autores de la institución primero de manera predeterminada.
César Augusto Olivares Poggi
30:14
Esto puede suceder más a menudo cuando el repositorio también se está utilizando como CRIS.
César Augusto Olivares Poggi
30:20
Será útil educar a cualquier persona que trabaje en el repositorio sobre la importancia de un correcto orden de autores en los metadatos que ingresan.
César Augusto Olivares Poggi
30:28
No incluir a todos los autores de un artículo en las metaetiquetas de autor es otro problema común en algunos repositorios.
César Augusto Olivares Poggi
30:33
La mayoría de las veces, cuando esto sucede, solo se incluye a los autores de la institución.
César Augusto Olivares Poggi
31:09
Esto también es particularmente común para los híbridos CRIS-repositorio.
César Augusto Olivares Poggi
31:17
Si su repositorio tiene este error, simplemente agregue los autores que faltan en las metaetiquetas.
César Augusto Olivares Poggi
31:22
¡En el orden correcto, por supuesto!
César Augusto Olivares Poggi
31:31
También a veces vemos el problema opuesto de demasiados autores incluidos en las metaetiquetas. Aquí, en mi clásico ejemplo de una tesis muy temática de California, pueden ver el caso más común de incluir demasiados autores en las metaetiquetas, que incluye al asesor de la tesis como autor.
César Augusto Olivares Poggi
31:44
Solo el autor de la tesis debe incluirse como autor en las metaetiquetas de autor.
César Augusto Olivares Poggi
31:53
A veces, las metaetiquetas incluyen información que no corresponde, como el nombre del repositorio o el tipo de documento.
César Augusto Olivares Poggi
32:08
Esto es especialmente común en metaetiquetas de título. En primer lugar, recomiendo evitar agregar cualquier otro elemento que no sea información bibliográfica del artículo a las metaetiquetas, y segundo, eliminar cualquier información no bibliográfica de las metaetiquetas que encuentre.
César Augusto Olivares Poggi
32:15
El último error común de metaetiquetas es la combinación de varios idiomas o alfabetos en las metaetiquetas de una única publicación, lo que resulta en información bibliográfica mixta, a menudo duplicada.
César Augusto Olivares Poggi
32:20
Esto causa confusión tanto para el sistema de indexación de Google Académico como para los investigadores que pueden, por ejemplo, hacer clic en un resultado de búsqueda de Google Académico que parece ser un artículo escrito en un idioma familiar, y terminar en un PDF que no pueden leer.
César Augusto Olivares Poggi
32:44
La solución para este problema es usar el idioma del texto completo si lo tiene, o en su defecto del resumen, como una guía para el idioma que se usará en las metaetiquetas de la publicación.
César Augusto Olivares Poggi
32:55
No duplique esta información, ya sea dentro de una misma metaetiqueta o en múltiples metaetiquetas con diferentes alfabetos.
César Augusto Olivares Poggi
33:00
Si también tiene una versión traducida de la publicación, la mejor práctica es darle a cada versión su propio registro separado en el repositorio, con metaetiquetas en ese idioma.
César Augusto Olivares Poggi
33:15
Con eso, ya han visto la causa de los principales errores en repositorios DSpace.
César Augusto Olivares Poggi
33:21
Con menos frecuencia, ocasionalmente hay casos en que el rastreador no puede encontrar los elementos en su repositorio, ya sea porque el sitio está inactivo o porque algún tipo de configuración del sitio ha bloqueado activamente el rastreador.
César Augusto Olivares Poggi
33:30
Procure evitar que su sitio quede inactivo durante un período de tiempo significativo para reducir las posibilidades de que el rastreador esté tratando de encontrar sus publicaciones mientras están inaccesibles.
César Augusto Olivares Poggi
33:37
Y como mencioné anteriormente, la configuración predeterminada de DSpace para rastreadores funciona bien. Casi nunca hay necesidad de ajustarla.
César Augusto Olivares Poggi
33:45
Asegúrese de configurar redirecciones si su repositorio migra a un nuevo dominio, o si renumera los elementos.
César Augusto Olivares Poggi
33:51
Los formularios intersticiales, ya sean formularios de registro o aceptación de términos de uso por única vez, causan problemas para los sistemas de indexación y, a menudo, son percibidos como encubrimientos.
César Augusto Olivares Poggi
33:59
Y las páginas de portada pueden provocar una disminución sistemática de la cobertura de su repositorio, pues a menudo estropean la extracción automática de metadatos.
César Augusto Olivares Poggi
34:13
Ahora que saben cómo detectar y solucionar los errores más comunes que pueden causar que sus repositorios sean eliminados del índice de Google Académico, quiero asegurarme de que también sepan cómo realizar correctamente una verificación de cobertura.
César Augusto Olivares Poggi
34:21
Quiero comenzar haciendo hincapié en lo que no funciona, que es utilizar el número de resultados de búsqueda del sitio de su repositorio en la búsqueda de Google Académico.
César Augusto Olivares Poggi
34:27
La cantidad de resultados que vea será inexacta porque estos números solo se aplican a los enlaces principales.
César Augusto Olivares Poggi
34:33
Como describí anteriormente, la versión del repositorio de un elemento a menudo no es el enlace principal, sino que se encuentra detrás del enlace "Las # las versiones".
César Augusto Olivares Poggi
34:40
Eso significa que el número que verá como el recuento resultante para su sitio probablemente será muy inferior al número real de elementos indexados.
César Augusto Olivares Poggi
34:51
En lugar de ello, la mejor manera de verificar la cobertura de Scholar es elegir al azar varios elementos seleccionados de diferentes colecciones de su repositorio y buscar estos títulos en Scholar.
César Augusto Olivares Poggi
35:00
Asegúrese de hacer clic en el enlace "Las # versiones" para ir a la página de todas las versiones, como se ilustra aquí, y luego ver si hay un enlace a la versión de su repositorio.
César Augusto Olivares Poggi
35:09
Si para todos estos títulos encuentran enlaces a las versiones de su repositorio, están en buena forma. Si no es así, ¡ahora saben cómo comenzar a solucionar problemas!
César Augusto Olivares Poggi
35:26
Antes de pasar a las preguntas, quiero terminar compartiéndoles algunas referencias y pautas realmente útiles sobre Google Académico.
César Augusto Olivares Poggi
35:30
La primera es la documentación de Google Académico.
César Augusto Olivares Poggi
35:37
Si ingresa a scholar punto google punto com y hace clic en "Ayuda" en la esquina inferior derecha de la página, será llevado a nuestra documentación.
César Augusto Olivares Poggi
35:41
A partir de ahí, la sección titulada "Inclusión" les brinda una visión global del proceso de indexación.
César Augusto Olivares Poggi
35:46
Incluye la lista de ejemplos de metaetiquetas que les mostré, junto con las pautas de solución de problemas de las que hablé hoy, y algunas más.
César Augusto Olivares Poggi
35:53
También les recomiendo las diapositivas de una presentación que el fundador de Google Académico, Anurag Acharya, dio en la conferencia Open Repositories hace unos años.
César Augusto Olivares Poggi
35:59
Se enfoca en una gama de plataformas de repositorio y proporciona un contexto útil para las mejores prácticas recomendadas por Google Académico para los repositorios.
César Augusto Olivares Poggi
36:24
¡Gracias!Disculpas por no estar alineados con los slides
César Augusto Olivares Poggi
36:28
Compartiré estas diapositivas más adelante esta semana con todos los que se registraron para este seminario web. No es demasiado tarde para registrarse si desean recibirlas.
César Augusto Olivares Poggi
36:36
Me gustaría ahora invitar a Cesar, a unirse a mí para preguntas. Ahora es un buen momento para activar sus micrófonos si tienen preguntas que les gustaría hacer. También pueden escribirlas en el cuadro de chat.
César Augusto Olivares Poggi
40:21
mwestin@google.com
Monica Westin
52:54
https://scholar.google.com/intl/en/scholar/inclusion.html#indexing
Alberto García
53:29
I cannot see it.
Monica Westin
54:33
https://scholar.google.com/intl/en/scholar/inclusion.html#indexing
Alberto García
55:15
Thanks!
Monica Westin
55:53
De nada :)
Carmen Julia Pizarro Feliciano
56:37
cuando se generan modificaciones en el repositorio institucional, ¿cuánto tiempo tardara en actualizarce en Google Académico?
Minerva Castro Escamilla
01:00:45
Buen día, Monica y Carlos, cómo sabes que tenemos una indización correcta de nuestro repositorio?
Minerva Castro Escamilla
01:01:02
cómo sabemos que tenemos una indización correcta de nuestro repositorio?
Carmen Julia Pizarro Feliciano
01:01:58
todos las tesis que son subidas al repositorio institucional, son visualizadas en el google académico, o existe un filtro de publicación
Lorena Pilloni
01:04:15
¿es recomendable que las revistas creen un perfil de google scholar?
Minerva Castro Escamilla
01:04:19
Una pregunta más, Cesar: Es coveniente crear un perfil en google académico de nuestro repositorio?
Monica Westin
01:12:30
Wilfredo: mwestin@google.com
Monica Westin
01:14:12
¡Gracias a todos! Disculpas de nuevo por no estar alineados con las diapositivas. Esto fue un verdadero placer. Mi correo electrónico es mwestin@google.com.
Michele Mennielli
01:14:56
Muchas Gracias a todos!!