- Los weblogs o diarios de
ideas - El filtrado colaborativo: la voz de
la colmena - Dos millones y medio de
tecno-freaks, todos opinando al mismo
tiempo - Quid moderat ipsos
moderatores? - Algo a cambio de casi nada: el
filtro recursivo de votaciones
implícitas - Notas al pie
Este artículo -que sinDominio reproduce
aquí con el amable permiso de su autor- apareció
formando parte de la recopilación "Para poder pensar",
publicado en la Revista de Occidente (Madrid), en
marzo del 2001. La revista
presentaba el siguiente
Índice:
Para poder pensar. Encuentro, creación y
transmisión en la Red", por José Antonio
Millán
Cómo podríamos pensar", por
Vannevar
Bush
"En el comienzo era el rumor", por Roberto
Blatt
"¿Muerte o
transfiguración del lector?", por Roger
Chartier
"La Web como memoria organizada: el hipocampo colectivo
de la red", por Javier
Candeira
Sobre los autores
"La diferencia entre información y conocimiento
es la siguiente:
– información es cuando tienes el número
de teléfono de Christie
Turlington;
– conocimiento es cuando tienes a Christie Turlington
[1]
P.J. O’RourkeAge and Guile Will Beat Youth,
Innocence And A Bad Haircut
La primavera pasada, una noticia recogida por la BBC
llamó mi atención. Científicos del London
University College habían descubierto que los cerebros de
los taxistas londinenses tenían el hipocampo más
grande que los de las personas que no conducían taxis por
Londres. No sólo lo tenían
más grande (de media, que se dice en estos casos) como
colectivo; el crecimiento del hipocampo era más acusado en
aquellos profesionales que llevaban más tiempo en el
oficio. Ser taxista en Londres hace que le crezca a uno el
hipocampo, vaya.
La causa de este crecimiento se atribuye al hecho de que
para obtener la licencia, un taxista ha de conocer de memoria el
intrincado callejero londinense, también conocido como The
Knowledge [3] El
Conocimiento, con K mayúscula. El Conocimiento por
antonomasia. Extraer una primera conclusión es tan
fácil como castizo: el saber sí que ocupa lugar,
después de todo. Lo que los científicos
británicos deducen es más complejo: el hipocampo,
lugar del cerebro donde los
neurólogos sospechan que puede residir la coordinación de la memoria,
crece según aumenta la capacidad del individuo de
navegar por su entorno.
No se trata de una simple memoria literal; la capacidad
de recordar está tan entrecruzada y relacionada como
posibles rutas hay entre dos puntos cualesquiera de una
metrópolis. Se diría que el nombre dado al
callejero es especialmente apropiado, porque lo que almacenan los
cerebros humanos no es información, sino conocimiento. Y
el hipocampo es, según parece demostrar el experimento
londinense, lo que nos hace capaz de recordar y navegar por
nuestro entorno, gracias al conocimiento adquirido a
través de la experiencia.
En su libro El
arte de la
memoria, (Taurus, 1974), Frances Yates describe la
mnemotécnica griega como una ciencia
hermética, en la que cada idea o concepto se
asocia a una habitación de un edificio, el Palacio de la
Memoria. El origen de esta técnica se atribuye al poeta
griego Simónides, pero su escuela se puede
rastrear hasta el Renacimiento a
través de Cicerón, Santo Tomás de
Aquino y Giordano Bruno. Los novatos en este arte de recordar
basaban sus palacios en edificios reales, pero los maestros
podían inventar espacios artificiales, llenos de alcobas y
nichos en los que depositar sus recuerdos. Que esta
técnica, arte o ciencia de la memoria tenga una utilidad real es
muy revelador: en el cerebro humano los recuerdos y la capacidad
de visualización espacial están relacionados de una
forma que permite recuperarlos a voluntad.
El título de este artículo es una
metáfora inspirada por el descubrimiento londinense. Pido
de antemano disculpas a los neurofisiólogos que, con el
vello del cogote erizado, estén en este momento dejando
caer su ejemplar de la Revista de Occidente y corriendo hacia sus
escritorios para componer una bien mesurada pero enérgica
carta de
protesta al editor. No sé si Internet se parece
más al hipocampo que a la hipófisis, o al menos no
estoy muy seguro. Pero
estoy convencido de que Internet actúa como un sistema nervioso
de orden superior, que interconecta y coordina operaciones en
las que la voz de la colmena es más eficiente, más
cierta, más afortunada que la voz de cada uno de sus
individuos.
Si el mundo está, como vislumbraba Teilhard de
Chardin, recubierto de una noosfera, una capa de materia
pensante con una conciencia
propia, la Internet es el sistema nervioso
artificial que nos permite pensar como una comunidad, con
facultades que superan a la de cada una de sus partes, sea
cualitativa o cuantitativamente. Esas partes que integran la
noosfera somos nosotros, y la Web es nuestro hipocampo colectivo,
la sede de nuestra común memoria y capacidad de
asociación, navegación y filtrado. Teilhard de
Chardin habría dicho que la evolución
humana culmina en una evolución cultural y tecnológica,
que se encarna en un órgano cerebral externo.
Propuesta la tesis,
entremos en la exposición
Los weblogs o
diarios de ideas
Una forma muy conveniente de organizar la memoria es
mediante las narrativas. Todos recurrimos a ellas en alguna
ocasión: no encontramos las llaves y tratamos de
recomponer la secuencia de acciones entre
la entrada en la casa y el primer recuerdo consciente de haber
extraviado el llavero. Esta es también una de las muchas
funciones de
los weblogs, o por lo menos una de sus utilidades.
Un weblog es, esencialmente, una colección de
enlaces (URLs) anotados. Su nombre, traducido literalmente,
significa "bitácora de la web", y de hecho gran
número de webloggers de habla hispana llaman
"bitácoras" a sus páginas. Existen muchos tipos de
weblogs, pero en este artículo sólo nos ocuparemos
de dos de sus acepciones más extremas. La primera es la
definición que el estadounidense Peter Merholz hace de
Peterme [5, su sitio personal en la
red. Merholz opina que la principal función de
una bitácora de red es servir de "diario de ideas"
[6, una especie de autobiografía
intelectual altamente informal y extemporánea, escrita con
la doble intención de provocar el diálogo y
servir de depósito para el pensamiento
Los webloggers como Merholz son un ejemplo de lo que el
visionario Vannevar Bush describió llamó trail
blazers, literalmente "abridores de sendas". En su influyente
artículo de 1945 As We May Think [que se reimprime en este
mismo número, N. del Ed.], Bush describía una
dispositivo mecánico similar al hipertexto actual, y
predecía la existencia de personas cuya función
sería bucear en los vastos océanos de
información y enhebrar un documento con otro, dejando una
estela de significado entre las olas de ruido,
contradicción y redundancia. Merholz y los webloggers como
él son estas personas; la lectura de
peterme.com es más que recomendada para quienes se
interesen por el diseño
de interfaz orientado al usuario, la crítica
de cómics, la teoría de
sistemas, el origen etimológico de ciertos
términos sexuales o la naturaleza de
los propios weblogs, entre otros muchos temas
La mejor forma de investigar en Internet sobre un tema
es buscar alguien que ya lo haya hecho y publique la
información al respecto. Los weblogs no pretenden ser
directorios sistemáticos: se parecen más a un
rastro de miguitas de pan dejado por una hormiga con suerte. Y la
naturaleza temporal de los weblogs (el propio Merholz
señala que "lo único se puede decir de todos los
weblogs es que son cronológicos") hace que la memoria
narrativa sea la mejor forma de recuperar una lectura medio
recordada. "¿Dónde leí esto?", se pregunta
uno rascándose la cabeza como hace cuando no logra
encontrar las llaves. "Estaba antes de una cita sobre Sim City y
después una referencia a los libros de
ciencia cognitiva de la editorial del MIT. ¡Ah, sí!
¡En Peterme!". Nótese que ese "antes y
después" puede referirse a la línea temporal del
propio navegante de Internet, según sigue el rastro de
enlaces. Pero esto no importa, al menos por ahora.
Está claro que hay gente con una voz propia que
nos produce confianza, y que podemos identificar claramente, y
orientarnos en su narración según nuestra
necesidad. Pero esto siempre ha sucedido, los individuos siempre
han tenido su voz, y los individuos singulares a menudo han
tenido su audiencia. Particularmente, me gusta la voz en la que
Peter Merholz compone su weblog. Pero se da una curiosa
paradoja
Tomemos dos millones de americanos al azar, mejor que
sean dos millones y medio para que se acerquen más al 1%
aproximado de la población, y démosles acceso a
Internet si aún no lo tienen, y enseñémosles
a usarla. Es casi seguro que entre esos dos millones y medio de
personas sepan más que Peter Merholz de casi cualquier
tema, incluídos los temas en los que Merholz es
especialista, sea por profesión o por afición. El
problema es cómo se extrae una voz inteligible de esa
multitud: dos millones y medio de personas no tienen una voz, lo
que tienen es una barahúndaAquí es donde entra en
juego lo que
la jerga informática (animada y patrocinada por el
espíritu del marketing)
llama "filtrado colaborativo".
El filtrado colaborativo: la
voz de la colmena
En los años 60 empezó a utilizarse por
parte de gobiernos, instituciones
internacionales y grandes empresas un
método de
prospectiva llamado "método Delphi", en
referencia al oráculo griego de Delfos. Creado en 1953 por
dos investigadores de la corporación RAND para dar
solución a un problema de planificación militar, el método
Delphi es el más popular de los sistemas para
recabar y refinar las opiniones de un grupo de
personas, normalmente un comité de expertos. El
método Delphi, sin embargo, tiene un grave defecto: exige
que los expertos estén informados del problema en
cuestión, requiere que les sea repartido un cuestionario,
y sólo es fiable si los expertos están dispuestos a
colaborar.
Nada nos hace pensar que nuestros dos millones y medio
de personas elegidas al azar cumplan estas condiciones, pese a
estar provistos de ese gran elemento socializador que es el
acceso a Internet. No sólo no son expertos previamente
seleccionados, sino que la información que emiten es
producto tan
sólo de la intersección entre sus necesidades, sus
conocimientos y su libre albedrío. Algunos están
locos. Otros mienten. Gran cantidad de ellos creen a pies
juntillas en lugares comunes, mitos urbanos
o "verdades" procedentes de la superstición o las
creencias religiosas más disparatadas. Dada cualquier
pregunta cuya respuesta no sea claramente obvia ("¿Hay
luz durante el
día?"), aproximadamente la mitad de nuestros seleccionados
contradice a la otra mitad. De hecho, una mitad contradice a la
otra de forma espontánea, sin que medie pregunta
previa
Y, sin embargo, sigo afirmando que estos dos millones y
medio de personas no sólo saben más de casi
cualquier tema que cualquier experto elegido arbitrariamente,
sino que Internet nos provee de mecanismos para extraer
conocimiento válido de esa grande y ruidosa
confusión.
El más notorio experimento de "filtrado
colaborativo", y el que dio origen al término, es Firefly,
el sistema de recomendaciones gestado en el Instituto
Tecnológico de Massachusetts por Patti Maes [7]. Este sistema, que en sus principios
todavía recibía el nombre de "agente de software", resolvía
el problema de la falta de coordinación de la masa…
coordinándola. Al registrarse, el usuario tenía que
responder a una serie de preguntas sobre sus gustos musicales,
comparando unos discos y artistas con otros y puntuándolos
en una escala
numérica. Tras ese primer "entrenamiento",
el "agente" era capaz de recomendarnos nuevos discos
basándose en los gustos de los demás usuarios del
sistema.
El sistema fue un fracaso comercial, y como "usuario"
puedo decir que entiendo por qué. Firefly tenía una
nefasta tendencia a dar datos sin aportar
información. Lo cual, traducido al español
que se habla en Occidente, significa que no contaba nada nuevo.
Las recomendaciones eran siempre obvias, sin nada de la gracia
que tiene cualquier desconocido que nos recomienda un disco tras
una breve conversación. Y para ese viaje no hacen falta
alforjas, que en este caso son el registro previo y
el tercer grado inicial.
Un sistema similar con mejores resultados es el que
tienen los grandes almacenes online
Amazon, antes conocidos como librería online Amazon
[8].
- Si consultamos la ficha de un libro cualquiera, por
ejemplo The Art of Memory, de Frances Yates, el sistema nos
informa de otros libros que han comprado los clientes que se
llevaron el título consultadoThe Memory Palace of Matteo
Ricci by Jonathan D. Spence - Giordano Bruno and the Hermetic Tradition by Frances
A. Yates - In the Palaces of Memory: How We Build the Worlds
Inside Our Heads by George Johnson - The Rosicrucian Enlightenment by Frances A.
Yates
La selección
parece bastante obvia, son dos libros más de la misma
autora y dos libros con el mismo tema que el que provoca la
búsqueda, hasta el punto de que comparten un par de
palabras-clave (memory y palace). Este sistema no nos propone
nada que no hubiéramos encontrado por cuenta propia, sin
más que dar los pasos lógicos. Sin embargo el
sistema de Amazon tiene ya una ventaja clara sobre el Firefly de
Maes: trabaja con información implícita, y no
requiere que sus clientes se sometan a cuestionarios.
"Masajeando" la base de datos
que contiene la información de sus clientes (y sin romper
su anonimato), Amazon puede ofrecernos recomendaciones basadas en
datos reales. Es posible engañar a un sistema ante
preguntas que no requieren ningún compromiso, y los
algoritmos de
Firefly quizá confíen demasiado en que la gente no
vaya a mentir al contestar a su cuestionario previo. En la
expresión popular norteamericana, los clientes de Amazon
"votan con su dinero", con
lo que se supone que su compromiso con las decisiones que toman
es más sincero
Pero además Amazon parece funcionar mejor que
Firefly. Podría ser una cuestión de mi
imaginación, o puede que sea un efecto de cómo la
acumulación de datos cuantitativos (Amazon es, con
diferencia, el primer vendedor de productos
culturales en la red) produce datos cualitativos. También
podría ser que, pese a no haberlos inventado, los
programadores de Amazon hayan sabido refinar mejor que Pattie
Maes sus algoritmos de filtrado colaborativo. Existe una
última posibilidad, y es que, por las
características comerciales de los respectivos mercados o por la
naturaleza de sus contenidos, los libros se presten más
que la música a la
selección automática este tipo de algoritmos. El
caso es que, en ocasiones, Amazon nos sorprende con
recomendaciones tan acertadas como inesperadas.
Introduzcamos, por ejemplo, el título
Systemantics: The Underground Text Of Systems Lore, un libro, por
cierto, que viene muy bien recomendado por Peter Merholz. Estas
son las sugerencias que hace Amazon, basadas en las compras de otros
clientes·
- The Logic of Failure by Dietrich Dorner, et
al. - Living on the Fault Line : Managing for Shareholder
Value in the Age of the Internet by Geoffrey A.
Moore - Patterns of Software : Tales from the Software
Community by Richard P. Gabriel - Humane Interface, The: New Directions for Designing
Interactive Systems by Jef Raskin
Interesante: uno de los libros viene firmado por Jef
Raskin, iniciador del proyecto
Macintosh en Apple. Otro de ellos es obra de Geoffrey Moore, un
gran teórico sobre el desarrollo
comercial de la tecnología. No
conozco a los otros dos autores, pero los títulos me
atraen, el primero (La lógica
del fracaso/fallo) porque me sugiere que es una teoría
general de "por qué las cosas no salen bien", algo que ha
intrigado al alma humana
desde el desgraciado incidente de la serpiente y el arbol
plantado en el centro del Eden, y el segundo porque me parece
interesante el posible enfoque antropológico, o de
historia oral,
del estudio de los patrones o pautas en la ingeniería del software. Sobre todo,
ninguno de los títulos ni los autores, con la posible
excepción de The Logic of Failure, habría aparecido
en una búsqueda superficial por palabras-clave más
o menos obvias. En cualquier caso, esta vez Amazon ha acertado
conmigo, o yo con Amazon. Quizá fuera bueno que
experimentaran ustedes, y llegaran a sus propias
conclusiones.
Pero recabar votaciones involuntarias o
"implícitas" es mucho más fácil
todavía, y mucho más útil de una manera
cotidiana y prosaica. Un ejemplo concreto:
¿Cómo se escribe, Gutenberg o Gutemberg? Introduzco
ambas variantes en Altavista[9], un
buscador de texto
completo, y me fabrico una concordancia instantánea en dos
pasos:
- Gutemberg: 4,315 pages found
- Gutenberg: 119,275 pages found
La votación no es menos arrasadora por
implícita. Los autores de las 123.590 páginas
indizadas por Altavista no están respondiendo a la
pregunta "¿Cuál es la grafía correcta del
nombre del inventor de la imprenta de
tipo móvil?" más que de forma implícita,
pero los resultados son igualmente válidos. Yo me dejo
llevar por el consenso, y no creo que los 4.315 heterodoxos (o
menos, algún autor puede haber confeccionado más de
una página) sean de mucho fiar.
Sería fácil escribir una pequeña
aplicación que aceptara dos o más términos
(ni siquiera tienen por que ser grafías alternativas de
una misma palabra), comprobara su frecuencia de aparición
en la base de datos de Altavista o cualquier otro buscador y
ordenara los resultados en orden creciente o decreciente. Pero lo
más importante es que, al igual que en el ejemplo de
Amazon, la información se "cosecha" de entre los datos que
voluntariamente hacen públicos sus emisores, sea al hacer
sus compras o publicar sus páginas
web. Nuestro proceso de
recolección y refinamiento de la información no
requiere esfuerzo extra por parte de sus emisores, no exige su
atención.
El economista Michael Goldhaber postula que en la era de
la creación y transmisión digital de los canales y
los contenidos que los llenan, el recurso escaso es nuestra
atención. El contenido es multiplicable hasta el infinito,
mientras que la atención es indivisible, y el tiempo del
que disponemos es el auténtico recurso escaso. Esta
escasez es la que
crea una "nueva economía natural de
la red", que Goldhaber llama "La Economía de la
Atención" (nota)[10] según
la definición que dice que la economía es el arte
de la optimización de los recursos escasos,
y valiosos, y que en la sociedad de la
información la atención no sólo es escasa,
sino valiosa en términos que se pueden
contabilizar.
Nuestros mecanismos de filtrado colaborativo, el de
Amazon y el sistema casero de comprobación de ortografía, que les recomiendo que se tomen
con una buena dosis de caveat emptor, tienen a su favor que, en
términos de atención, son gratuitos para los
proveedores de
la información, y de muy bajo precio para
los consumidores, en el caso de Amazon.
Sin embargo hay casos en los que los proveedores de la
información son también sus consumidores, y como
tales están dispuestos a "gastar" un poco de su
atención para mejorar la calidad de la
información que consumen. Esta calidad se mide en algo
que, por analogía con la ingeniería de telecomunicaciones, llamaremos
"señal/ruido". Entre otros términos.
Dos millones y medio de
tecno-freaks, todos opinando al mismo tiempo
Slashdot[11] es un sitio de
noticias sobre
software
libre, ciencia, política digital y
derechos civiles,
tecnología y hardware, Linux y Unix en
general, Legos, Star Wars… la lista exhaustiva de temas es
demasiado larga para este artículo. El sitio se autodefine
con el lema News for Nerds. Stuff that Matters, lo que traducido
libremente viene a decir algo así como "Noticias para
empollones. Cosas que importan".[12]
Slashdot es un weblog colaborativo y automoderado, en el
que los lectores son los que proponen y escriben la mayor parte
de las "historias" o noticias, y también pueden
comentarlas mediante un sistema que no sonará a nuevo a
quienes ya estén familiarizados con este tipo de foros
electrónicos. El lector que desee hacer un comentario
puede introducirlo en el sistema, sea como respuesta a la noticia
principal, o como glosa a otro comentario anterior. El resultado
es una estructura
arborescente de comentarios a comentarios a comentarios, que
dirían Gertrude Stein o Jonathan Swift. Las líneas
de discusión que unen una secuencia de comentarios a
comentarios se llaman "hilos" o "threads", y terminan (o, mejor
dicho, empiezan) necesariamente en una noticia. (nota)[13]
Hemos dicho que Slashdot es un weblog colaborativo y
automoderado.Veamos qué significa eso. Si un weblog es,
según nuestra anterior definición, una lista
cronológica de enlaces comentados, el aspecto colaborativo
de Slashdot lo aporta el hecho de que cualquier lector puede
proponer su enlace junto con su comentario. En este sentido los
autores de Slashdot son sus lectores desde la primera iniciativa.
Pero si esto fuera todo, Slashdot y los sitios de su mismo estilo
no se diferenciarían en nada de un tablón de corcho
en la pared de un instituto, o en las paredes de un urinario
público.
Cualquiera puede proponer una noticia mediante el
formulario habilitado al efecto, y hacerlo anónimamente
(protegido si quiere por un apodo autoescogido). Pero la portada
de Slashdot o de cualquiera de sus secciones se compone de una
selección de las noticias propuestas. Los encargados de
esta selección son los llamados editores, que lo son en el
sentido que en el mundo de la edición
anglosajona recibe la palabra editor: seleccionan, refinan,
corrigen, comentan y (en ocasiones) recortan las noticias
propuestas antes de publicarlas.
Hasta aquí el proceso es similar al de
publicación en las cartas al
director de un periódico.
Pero en este momento es donde entra en funcionamiento el
verdadero corazón de
Slashdot. Los lectores empiezan a poner sus comentarios. Al
contrario que en la mayor parte de los foros albergados por
medios de
comunicación tradicionales, aquí los temas han
sido propuestos por los propios lectores. Al contrario que en las
cartas al director de los medios
impresos, en los que el único que responde al lector es,
en ocasiones, el redactor jefe, aquí todos se pueden
responder entre sí. La calidad de los comentarios es
fundamental. Entre los usuarios de Barrapunto [14], el sitio inspirado en Slashdot que
co-mantengo, existe el consenso de que el valor de un
sitio como Slashdot no reside en las noticias, sino en los
comentarios de sus usuarios [15].
El resultado es una estupenda cacofonía
libertaria de opiniones y contra-opiniones, datos informativos,
mentiras y rumores, chistes,
momentos de inspiración, comentarios que no vienen al
caso, flames y trolls. Estos tres últimos tipos merecen su
explicación aparte, pues son el motivo histórico
que dio origen al sistema de moderación. Un flame es un
insulto, una diatriba que se sale del tono de la discusión
sin contribuir al debate. Los
foros de discusión online aceptan bien la ironía, e
incluso el sarcasmo, pero el insulto personal o el desbarre
fóbico están muy mal vistos. Un troll es un
comentario provocador, a menudo en busca de que alguien responda
con un flame. Un comentario que no viene al caso es simplemente
eso, y los tres ejemplos, trolls, flames y offtopics tienden a
generar ruido en la discusión. En los términos de
la metáfora telemática antes citada, la relación
señal/ruido empeora, y el debate es menos
fructífero, o menos inteligible.
Históricamente, Slashdot empezó como una
página personal. Su creador Rob Malda, alias "CmdrTaco" y
un amigo llamado Jeff Bates, alias "hemos", colgaban en su web
las noticias que les interesaban, y abrían el foro al debate público.
Pronto Slashdot se hizo popular entre universitarios aficionados
a la informática sobre Linux y a la política del
Software
Libre. Demasiado popular, incluso, y pronto los debates
estaban llenos de comentarios como "First Post!" (¡Primer
comentario!") o "Quiero untar a Natalie Portman de gachas
calientes etc…". Incluso los comentarios que iban al grano
se repetían, mejorando la relación
señal/ruido en términos estadísticos, pero
disminuyendo la concentración de información
disponible. Este último ejemplo es comparable a las
ocasiones en que dictamos un número de teléfono dos
veces en un contestador. En este caso la redundancia ayuda a
la
comunicación, pero la concentración de
información por unidad de tiempo es menor.
La historia de cómo Malda fue experimentando con
distintos modelos de
moderación está muy bien contada por él
mismo[16]. Nosotros nos contentaremos con
describir la moderación en su estado actual
(octubre de 2000).
Como ya hemos dicho, cualquier lector puede proponer una
noticia. Para que esta noticia aparezca en la portada, es
necesario que un editor la publique. Una vez publicada una
noticia, cualquier lector puede añadir su comentario.
Hasta aquí, todo es sencillo.
Malda añadió al sistema un mecanismo
cualitativo y cuantitativo de puntuación de comentarios.
Cada comentario puede tener entre -1 y 5 puntos, y una
calificación adjetiva (interesante, offtopic, gracioso,
troll, informativo, sobrevalorado). El lector de Slashdot puede
elegir qué comentarios lee seleccionando el umbral de
corte. Quien quiera saber lo que es un troll no tiene más
que leer Slashdot con la moderación a -1. Quien quiere
leer sobre un tema y no tiene mucho tiempo puede hacerlo con el
umbral puesto a 5, con lo cual sólo leerá los
mejores comentarios, aquellos que han alcanzado la
puntuación más alta. Pero lo interesante no es
cómo los lectores usan el resultado de la
moderación, sino cómo la ejecutan sin ningún
tipo de supervisión por parte de los
editores.
Para ser moderador es necesario ser usuario registrado.
Esta condición es evidente, puesto que la idea de la
moderación es que entre todos los lectores de Slashdot
extraigamos la voz comunal del sitio, y la navegación
anónima no permite saber si un visitante forma o no parte
de la comunidad. Así que los "Anonymous Cowards" o
"Pendejos sin Nombre" (terminología de Barrapunto), apodo
que reciben los contribuyentes anónimos, pueden proponer
noticias para su aprobación por un editor y comentar
libremente las que pasan ese primer filtro, pero no tienen la
capacidad de moderar. Podemos decir que poner comentarios es un
derecho, pero moderarlos es un privilegio acordado sólo a
ciertos miembros de la comunidad.
Periódicamente, el sistema informático que
genera las páginas HTML de Slashdot
y controla su base de datos ejecuta un programa que
cuenta el número de noticias y comentarios, y
evalúa el número de puntos de moderación
necesarios para calificarlos. Una lotería reparte esos
puntos (en lotes de 5) entre los usuarios registrados que visitan
el sitio, según un baremo especial. Los visitantes poco
asiduos están descontados, porque se supone que no conocen
lo bastante bien el espíritu del sitio, y no lo pueden
representar. Los visitantes más frecuentes son gente que
tiene "demasiado tiempo libre", y Malda no los considera fiables:
el moderador ideal está en el punto medio.
Existen más mecanismos de control que
aseguran que la moderación escoja los mejores comentarios.
Para evitar que alguien pueda "ahorrar" sus puntos hasta que se
toque un tema en el que esté personalmente involucrado, y
modere arrimando el ascua a su sardina en lugar de elegir los
comentarios que más contribuyen al debate, los puntos
caducan a los tres días. Si no se usan, se pierden.
También es imposible moderar comentarios de una noticia
que uno mismo haya comentado. O se comenta, o se modera, pero no
se pueden hacer las dos cosas en la misma noticia. De este modo
se evita que alguen pueda darle sus puntos a su propio
comentario, o a un comentario con el que simplemente esté
de acuerdo, sin importarle la calidad que pueda aportar al
discurso.
Cada acto de moderación tiene también,
como hemos dicho, un componente cualitativo. No sólo
otorgamos o restamos un punto al comentario, también
decimos por qué lo hacemos. Si decimos que un comentario
es gracioso, interesante, informativo o infravalorado en
relación con los demás, le añadiremos un
punto que se restará de nuestra cuenta. Si nuestra
calificación es de redundante, troll, sobrevalorado o
fuera del tema, le restaremos un punto de los que tenemos para
moderar. Ningún comentario puede tener más de 5
puntos, ni menos de -1. No tiene sentido moderar hacia arriba un
comentario calificado con un 5, ni hacia abajo un -1
troll.
Esto funciona especialmente bien a la hora de usar los
parámetros de moderación como lector. Un troll es
un troll en cualquier forma en que aparezca, y a no ser que uno
tenga un sentido del humor particularmente inmaduro, leer
Slashdot asignando -1 al umbral de moderación es un acto
que oscila entre la curiosidad malsana y el puro
masoquismo.
Los comentarios ya nacen con un valor de
moderación. Si quien los aporta es un usuario registrado,
su valor es automáticamente igual a 1. Si son aportaciones
anónimas (uno de los mayores contribuyentes a Slashdot se
llama A. Nonymous y se apellida Coward) su valor inicial de
moderación es cero. Esto incentiva la participación
y el registro, y también da por hecho que la calidad de
los comentarios es proporcional a la responsabilidad que uno sobre sus palabras. Es una
lástima que en esta asignación de ceros puedan caer
algunos justos con los pecadores (mucha gente considera necesario
contribuir anónimamente, por lo común por razones
laborales), pero en general el sistema incentiva el esfuerzo en
redactar una nota que se ajuste al tema, sea informativa, no sea
redundante y, a ser posible tenga algo de espíritu
original.
¿Saben lo curioso? El sistema funciona. Un
reciente estudio realizado por el holandés Johan Pouwelse
con vistas a su doctorado en la Universidad de
Delft calcula que el sistema de moderación identifica un
comentario inspirado (insightful) en tan sólo 37
minutos[17]. Lo interesante del sistema
es que cada moderador independiente dedica a la moderación
mucho menos tiempo. De hecho, el acto de moderar está
asociado a la lectura de los comentarios del sitio (algo que los
moderadores hacen frecuentemente de todas formas, o el algoritmo de
Malda no les adjudicaría los puntos de moderación),
así que para un lector de Slashdot, el coste de moderar
es, en términos de economía de la atención,
prácticamente cero. Sin embargo, la suma (o debería
decir mejor la integración, pues los elementos sumados se
acercan a cero) de todos esos actos de moderación
individuales produce un efecto macroscópico imposible de
lograr por una sola persona.
Un individuo podría realizar esa
moderación, pero a) tardaría más y b)
moderaría menos cantidad de comentarios. La
moderación de Slashdot se realiza en paralelo, y durante
los 37 minutos que Powelse ha calculado que se tarda en que
emerja un comentario inspirado, muchos otros comentarios flotan a
la superficie por informativos, interesantes o graciosos, y otros
tantos se hunden en los abismos del -1 por redundantes, alejados
de la cuestión, insultones o simplemente por idiotas. El
corazón de Slashdot funciona como un sistema nervioso de
orden superior, que coordina todos estos minúsculos
esfuerzos intelectuales
(minúsculos cuando la métrica que aplicamos es la
Economía de la Atención) para extraer de ellos
opiniones colectivas, la voz de la comunidad de lectores de
Slashdot.
Si consideramos que Slashdot es un repositorio de
información y opinión (un análogo de la
memoria externa), el sistema de moderación es un filtro
distribuido, que en vez de residir en un solo programa
está repartido por los ordenadores coloidales que cada
lector guarda en su cabeza. Los comentarios moderados se
almacenan en Slashdot, que a partir de este momento deja de
almacenar mera información para convertirse en un
repositorio de conocimiento, el resultado de una
elaboración comunal de teorías, información, opiniones o
narrativas. Un hipocampo colectivo, si me permite decirlo el
único neurofisiólogo que todavía sigue
leyendo
El sistema de moderación, sin embargo, tiene sus
fallos. Los usuarios más activos (dentro
de un orden) adquieren el privilegio de la moderación con
mayor frecuencia, y tienen más mano en la evolución
temática de cada debate, y por tanto pueden sesgar la
identidad de
Slashdot hacia su ideología. Por esa razón existe un
sistema de meta-moderación.
Quid moderat ipsos
moderatores?
La cibernética es la moderna ciencia del
control en sistemas complejos, más concretamente del
autocontrol en sistemas autoregulados. En 1948, cuando Norbert
Wiener formuló su teoría, lo hizo basado en
investigaciones de Arturo Rosenbluth,
cardiólogo mexicano con el que colaboraba en el Instituto
Nacional de Cardiología [18]. El
descubrimiento de Wiener y Rosenbluth es que el corazón no
está guiado por el sistema nervioso
central, sino que se alimenta de las señales
nerviosas que él mismo genera, en un proceso de
realimentación o feedback. Así, mediante la
realimentación, es como se autoregulan los sistemas
complejos.
En Slashdot la realimentación se produce por un
sistema llamado Meta-Moderación. A cada usuario registrado
se le ofrece diariamente la posibilidad de juzgar una lista de
diez decisiones de moderación, marcándolas como
"justas" o "injustas" ("fair" y "unfair", respectivamente), o
declarar la abstención. Lo que se juzga no es el
comentario, sino el acto de moderar, y con ello y de forma
implícita, la capacidad de cada moderador. Un
meta-moderador puede encontrarse con varios comentarios repetidos
(un comentario puede haber sido moderado por más de una
persona), y juzgar cada decisión de moderación
independientemente de si está de acuerdo con el comentario
o no. Lo importante es declarar si este comentario contribuye a
mejorar la calidad del debate.
Los moderadores que sistemáticamente reciban
meta-moderaciones de "injusto" pueden perder la posibilidad de
adquirir el estátus de moderación. Los moderadores
que sistemáticamente reciben meta-moderaciones de
"justo’ ganan unos puntos que Malda ha bautizado "Karma".
Los usuarios con elevado Karma tienen más probabilidades
de ganar la lotería de la moderación, además
de un privilegio añadido: sus comentarios entran
automáticamente con dos puntos, uno más que el que
reciben los usuarios sin Karma.
Recapitulando, en Slashdot tenemos:
- Propuestas de noticias, que cualquier visitante del
sitio puede hacer, esté o no registrado. - Noticias, que son escritas por los editores, o
seleccionadas de entre el corpus de propuestas enviadas por los
contribuyentes. - Comentarios, que de nuevo puede poner cualquiera,
pero que en el caso de los usuarios registrados que se
identifican ante el sistema reciben de entrada el nivel 1 de
interés. - Actos de moderación de comentarios, que son
realizados por los usuarios registrados que reciben
irregularmente el estátus de moderador. - Actos de meta-moderación, en los que cualquier
usuario registrado puede juzgar diariamente diez decisiones
realizadas por otros moderadores.
Apartándonos por un momento del tema de este
artículo, la metáfora biológica-ciborg de
Internet como cerebro colectivo, y utilizando un análisis
político, podemos ver que el sistema de propuestas,
noticias, comentarios, moderaciones y meta-moderaciones es un
sistema jerárquico de democracias de distintos
tipos:
- Propuestas: libertad de
expresión igual para todos, usuarios registrados o
no. - Noticias: las noticias se deciden individualmente por
miembros de una aristocracia, los editores, entre los que
existe un consenso de opinión pero también una
jerarquía, ya que algunos de los editores son los
dueños del garito. - Comentarios: democracia
asamblearia, libertad
total de palabra. Es importante hacer notar que el sistema de
moderación de Slashdot logra extraer el debate
interesante del discurso caótico sin perjudicar el
derecho a la libre expresión de sus contribuyentes.
Cualquiera que lea Slashdot con la moderación a -1
verá que nada se borra ni se suprime. Lo que la
moderación genera es un filtro, que los lectores pueden
usar si así lo desean. Los gritos de "¡Censura!",
cada vez más infrecuentes, son sólo pataletas sin
justificación. - Moderación: es una democracia censataria
(sólo pueden moderar los usuarios registrados que
cumplen unas condiciones adicionales), modulada por una especie
de "Lotería de Babilonia" de la que nos hablaba Borges. - Meta-Moderación: democracia censataria pura
(todos los usuarios registrados pueden votar, sin ninguna
condición adicional, con sólo
identificarse). - Karma: concebido como una medida cuantitativa del
valor de un individuo para la comunidad, el Karma puede
interpretarse como un reconocimiento de prestigio. El sistema
de Karma es una forma de meritocracia, en la que este prestigio
se adquiere mediante el trabajo
realizado en la comunidad (cuentan la cantidad y la calidad de
los comentarios, moderaciones y meta-moderaciones). Este
prestigio no sólo es cuantitativo, también se
puede instrumentalizar; dado que el elevado Karma confiere una
mayor probabilidad de
acceder al estátus de moderador, este ciclo se
realimenta positivamente, con lo que existen individuos con una
gran cantidad de Karma que no deja de crecer.
Dejo a los lectores de Revista de Occidente aficionados
a la política (o quizá me reserve yo para otro
ensayo), el
paralelismo entre el sistema de control editorial de Slashdot y
el parlamentarismo bicameral con separación entre los
poderes legislativo, ejecutivo y judicial.
Las actividades de meta-moderación sí que
requieren un esfuerzo voluntario, y en ese sentido son más
"caras" (siempre en término de economía de la
atención) que las meras moderaciones. Los usuarios que
meta-moderamos en Slashdot (porque me incluyo) lo hacemos con la
idea de que así ayudamos a la calidad del discurso que
recibimos, y que dado que el bien que producimos lo disftutamos
todos, no hay una relación de proporción entre el
esfuerzo y la recompensa. Un pequeño esfuerzo distribuido
entre todos (la
meta-moderación) produce una recompensa que todos
compartimos (un sistema de moderación más justo, y
con él una mayor calidad editorial del sitio) .[19]
No es casual que uno de los temas centrales de Slashdot
sea el Software Libre. Esta dinámica económica de reparto de los
esfuerzos y compartición de los resultados es una
característica del desarrollo informático en el
ámbito del software libre. En el campo de lo material
sucede al revés, ya que el esfuerzo se puede compartir o
repartir, pero la recompensa siempre se reparte. Pensemos en
cuatro de amigos hambrientos una tarde de sábado. Da lo
mismo que vayan todos juntos a comprar comida y que todos la
cocinen, o que cada uno se encargue de una cosa. Ya se compartan
o se repartan las tareas, el resultado siempre se
repartirá, pues es imposible que los cuatro se coman un
pollo entero si sólo hay un pollo. Esta interesante
digresión podría dar lugar a todo un
artículo sobre la economía del Software Libre, pero
en realidad es una forma de pasar a nuestro siguiente
punto.
Algo
a cambio de casi
nada: el filtro recursivo de votaciones
implícitas
El mejor buscador de Internet que hay en este momento,
sin ninguna duda, es Google.[20] Esta aseveración, que no
sé si es una verdad objetiva o simplemente un consenso
entre mis amigos y colegas, es decididamente mi opinión
personal, adquirida tras cuatro años de pasar la tercera
parte de mi horario laboral leyendo
resultados de un buscador u otro.
El sistema que emplea Google para refinar sus
búsquedas no es otro que nuestro viejo amigo el filtrado
colaborativo, extraído de una información que los
autores de los sitios web publican de forma implícita en
sus páginas: los enlaces hipertextuales. Si en nuestro
ejemplo de uso de Altavista como consejero ortográfico
cada palabra es un voto por esa variante ortográfica, en
Google cada enlace es una voto por la página a la que
apunta. Este sistema no pillará por sorpresa a los
lectores que conozcan el mundo académico, donde una de las
métricas de calidad del trabajo que se
realiza es el famoso y temible "citation index", el repertorio de
citas que unos científicos hacen del trabajo de los
demás, pero ordenado por receptores. Cada cita en un
trabajo académico es un tributo, un respaldo al trabajo de
un colega.
Un enlace, un voto. En esa gran votación
constante que es la masa de hipertexo que compone la Web, cada
decisión de enlazar es realizada por un humano que, enlace
por enlace hipertextual, va expresando una opinión sobre
la calidad de la información de destino. Esto no es nada
nuevo como concepto: otros buscadores
como Excite ya clasificaban las páginas web por un
prodecimiento similar similar, pero se ve que lo hacían
peor, porque los resultados de Google son espectacularmente
más pertinentes. Según lo poco que revelan acerca
de sus algoritmos los técnicos y directivos de la
compañía, Google refina el método mediante
un sistema de recursividad.
Las páginas que se consideran más valiosas
son las más enlazadas, y Google concede distinto valor al
texto que hay en el propio enlace y al texto que lo rodea. Pero
un enlace que provenga de una página más valiosa es
a su vez más valioso, en un bucle de realimentación
positiva que refina los resultados. En cierto sentido, Google
realiza el recorrido de seguir un enlace a otro, calculando el
valor de cada bucle (A enlaza a B enlaza a C enlaza de nuevo a A)
y realizando el mismo proceso que un esfuerzo de la memoria
narrativa por seguir el discurso hipertextual.
En este proceso recursivo Google no sólo le
ahorra esfuerzo al receptor de la información, a la
persona que la busca; tampoco requiere del emisor que la publica
ningún tipo de manipulación extra, ni la
asignación de categorías temáticas como
hacen los sistemas de recuperación documental por campos y
claves. Quien hace una página web
sólo tiene que enlazar a la página que le interese,
y procurar ser lo bastante interesante y publicitarse bien para
ser, a su vez, receptor de enlaces hipertextuales. En la
maraña de referencias resultante, Google se encarga del
resto.
Como en el ejemplo del software libre, cada uno aporta
su poquito de información, su trozo de la maraña, y
sin embargo todos disfrutamos del total. Se reparte el trabajo y
se comparten sus frutos. Compárese con los directorios
como Yahoo, donde cada sitio es evaluado por una persona para
decidir en qué categoría hay que incluirlo, o cada
editor ha de proponer la lista de palabras claves y
categorías en las que quiere que aparezcan sus
páginas.
Desde su lanzamiento sin pompa ni boato, Google ha ido
capturando la atención de usuarios, analistas, inversores
y empresarios. El último golpe de efecto ha sido la
adopción
de la tecnología Google por parte de Yahoo!, que al
integrarlo en su sitio le dio el último espaldarazo que
necesitaba. En España, el
buscador Ariadna y el sistema interno de búsquedas del
diario El Mundo también funcionan sobre Google, y la
calidad de los resultados avala el buen nombre que tiene el
buscador californiano.
Pero el argumento de autoridad del
mercado no es lo
que nos ocupa. Hay grandes éxitos empresariales basados en
productos que son llanamente inadecuados. Google funciona porque
incorpora la gran cantidad de conocimiento y experiencia
expresados en los enlaces hipertextuales, y los manipula como
tales, usando esa meta-información (información
acerca de la propia información que almacena en su base de
datos) para buscar más "inteligentemente" y dar mejores
resultados. Por el contrario, Altavista no utiliza la
información que su base de datos contiene sobre esa propia
información, y el resultado es sólo
información. Es el usuario el que tiene que hacer el
esfuerzo mental de selección, y en ocasiones recorrer un
número mayor de resultados para encontrar el dato
buscado.
En este sentido Google tiene un gradiente de
concentración de información: devuelve el mismo
número de resultados que Altavista, pero los mejores
están más cerca del principio de la tabla. Para
robar otra metáfora, esta vez de las matemáticas, es como si Google elevara la
información al cuadrado, aplicándosela a sí
misma, y así extrayera migajas de conocimiento. Por
retomar la cita que abre este ensayo, Altavista nos devuelve el
número de teléfono de la información que
estamos buscando, mientras que Google nos entrega directamente el
objeto de nuestra búsqueda.
Apenas estamos comenzando a vislumbrar el potencial de
estas tecnologías. Podemos ver la Web de dos formas, como
en estas imágenes
en las que el fondo y la figura se invierten, y lo mismo nos
parece un ánfora o una copa que un par de caras
enfrentadas vistas de perfil. Al igual que la escritura
tiene un significado distinto para el emisario que para el
archivero, para Gutenberg que para Platón,
la Web tiene dos caras. Por un lado, la Web es un medio de
comunicación [21], por otro lado
es un repositorio de información y datos, un sistema de
memoria exenta.
Cuando ambas figuras se mezclan en una sola, lo que
vemos es un sistema inteligente de memoria, una memoria
autoorganizada y navegable. La Web que emerge de experiencias de
moderación colectiva como Slashdot, buscadores que extraen
la información implícita en los enlaces como Google
y sistemas de filtrado colaborativo como el mecanismo de
recomendaciones de Amazon es una memoria colectiva e
inter-relacionada, el hipocampo cibernético de nuestra
noosfera.
[1] Los lectores de Revista de Occidente que
también lo sean de Vogue sabrán reconocer
en Christie Turlington a la famosa modelo de
portada [2]
http://news.bbc.co.uk/hi/english/static/avantgo/newsid_677000/677048.htm
[3] http://www.taxiknowledge.co.uk/
[4] Sobre Teilhard de Chardin y la relación de sus
teorías con las de McLuhan y con la explosión de
Internet, puede consultarse el artículo de Jennifer Cobb
Kreisler publicado en Wired y titulado "A Globe,
Clothing Itself With A Brain": http://www.wired.com/wired/archive/3.06/teilhard.html
[6] La definición de Merholz de
"¿Qué es un weblog? puede encontrarse en su
respuesta a la pregunta de otro insigne weblogger, Derek
Powazek: http://www.powazek.com/wtf/post/index.009
[7] Las investigaciones de Pattie Maes están
descritas por ella (pero en tercera persona, como si fuera
César o un futbolista pillado a traición por un
reportero radiofónico) misma en su página web en el
MIT: http://pattie.www.media.mit.edu/people/pattie/
Para leer una crítica tan ácida como apenas
velada de Pattie Maes y el valor real de sus sistemas de
"filtrado colaborativo" por Philip Greenspun, a la sazón
estudiante de doctorado en el MIT, échenle un vistazo a
este breve comentario, que no tiene desperdicio: https://www.monkey.org/geeks/archive/0002/msg00018.htm
[9] http://www.altavista.com/,
20 de octubre de 2000, 01:38 h
[10] The Attention Economy. The Natural Economy of the
Net. Michael Goldhaber, First Monday, número 4,
segundo año: http://www.firstmonday.dk/issues/issue2_4/goldhaber/
[11] http://slashdot.org/
[12] Sobre la traducción y significado de la palabra
"nerd" y su relación con "geek", vease Barrapunto (sitio
web en español inspirado por Slashdot): http://barrapunto.com/lengua/100/09/23/0919211
[13] Para entender de verdad Slashdot es imprescindible
leerlo y usarlo, contribuir y moderar. Quien no pueda hacerlo y
no se conforme con este artículo puede leer un análisis de por qué Slashdot es
fiable escrito por Matthew Priestley y publicada en First
Monday:
http://www.firstmonday.dk/issues/issue4_8/priestley/index.html
[15] "Lo mejor de Barrapunto son sus comentarios".
Léase el debate suscitado por la pregunta
"¿Qué temas son "los de Barrapunto"?, en particular
la aportación de José Luis de Vicente,
"Trystero":
http://www.barrapunto.com/features/100/02/11/1120257
[16] La mejor fuente para entender cómo funciona
la moderación de Slashdot es, por supuesto, el propio
Slashdot: http://slashdot.org/moderation
[17] Proyecto de tesis que mide la fiabilidad de la
moderación de Slashdot: http://slashcode.com/article.pl?sid=00/09/22/1445211
[18] Agradezco a Rafael Lozano-Hemmer que me haya
relatado la historia del nacimiento de la cibernética en
Ciudad de México.
Lozano-Hemmer es un artista Mexicano-Canadiense galardonado con
el premio Golden Nica, y cuyo trabajo Alzado Vectorial incluye
entre su documentación una breve reseña sobre
el nacimiento de la cibernética: http://www.alzado.net/referencia.html
[19] Compartir y repartir: a los efectos de estos
párrafos, compartir y repartir no son sinónimos.
Compartir implica que todas las personas que comparten disfrutan
del todo: se comparte un apellido, la visión de una
película en el cine, la
experiencia de un viaje inolvidable o el resultado de un
desarrollo de software libre. Nótese que todos los
ejemplos son inmateriales, están compuestos sólo de
información. Repartir implica que las personas que se
reparten algo disfrutan sólo de una fracción del
todo: se reparte el botín de un robo, se reparten hostias
en las peleas de barrio y en las comuniones de las iglesias, se
reparten caramelos entre los otros niños
cuando se llega por primera vez a una escuela. Nótese que
todos los ejemplos son materiales, o
bien son objetos físicos o acciones
físicas.
[21] Aprovecho cada ocasión que tengo para
puntualizarlo: Internet no es un medio, es un canal. Los
distintos medios que utilizan internet como canal son la Web, el
correo
electrónico, el telnet e incluso
la
televisión y la radio. Expongo
este análisis de modo algo más prolijo en mi
participación ante el I Congreso Nacional de Periodismo
Digital, accesible en:
http://www.barrapunto.com/features/100/01/20/1343236
Javier Candeira
El artículo es © de su autor y se publica en
sinDominio con el permiso de su autor y de su editor.
Última versión, 20 de agosto del 2001