Blog de Santiago
Just another WordPress.com weblog

Feb
18

Presentacion Power Point del Proyecto:

Video en Youtube del Proyecto:

Parte 1:

Parte 2:

Artículo:

http://www.mediafire.com/file/jxd4ge3nxnn/Articulo Diagnostico Médico.docx

Documento de Implementación del algoritmo:

http://www.mediafire.com/file/jmjjmoh13jc/Implementación del algoritmo.docx

Documento de Implementación de Tripletas:

http://www.mediafire.com/file/jlzzjnnjjmn/Implementación tripletas.docx

Ontología:

Archivo OWL:

http://www.mediafire.com/file/vzygziwt2mu/diagnostico_medico.owl

Archivo XML:

http://www.mediafire.com/file/zhgdonmelmh/diagnostico_medico.xml

Poster:

http://www.mediafire.com/file/zzmzxdm3knm/Poster diagnostico medico.jpg

Ago
02

Introducción:

La inteligencia artificial es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura física producen acciones o resultados que maximizan una medida de rendimiento determinada, basándose en la secuencia de entradas percibidas y en el conocimiento almacenado en tal arquitectura.

En la IA se puede observar dos enfoques diferentes:

  1. La IA concebida como el intento por desarrollar una tecnología capaz de proveer al ordenador capacidades de razonamiento similares a los de la inteligencia humana.
  1. La IA en su concepción como investigación relativa a los mecanismos de la inteligencia humana que se emplean en la simulación de validación de teorías.

CLUSTERING

El proceso de clustering consiste en la división de los datos en grupos de objetos similares. Para medir la similitud entre objetos se suelen utilizar diferentes formas de distancia: distancia euclídea, de Manhatan, de Mahalanobis, etc. El representar los datos por una serie de clusters, conlleva la pérdida de detalles, pero consigue la simplificación de los mismos.

Clustering es una técnica más de Aprendizaje Automático, en la que el aprendizaje realizado es no supervisado. Desde un punto de vista práctico, el clustering juega un papel muy importante en aplicaciones de minería de datos, tales como exploración de datos científicos, recuperación de la información y minería de texto, aplicaciones sobre bases de datos espaciales (tales como GIS o datos procedentes de astronomía), aplicaciones web, marketing, diagnóstico médico, análisis de ADN en biología computacional, y muchas otras.

ALGORITMOS DE CLUSTERING

El agrupamiento de datos o clustering puede definirse como un método para clasificar o describir propiedades de un sistema a partir de un conjunto de datos adquiridos o representativos de dicho sistema. La aplicación de estos algoritmos tiene como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iniciales por su posición privilegiada con respecto al total.

Algunos de los algoritmos de agrupamiento más utilizados son:

1.- K-means clustering

2.- Fuzzy c-means clustering

3.- Grupos próximos a un entorno (nearest neighborhood clustering)

4.- Redes de aprendizaje competitivo

5.- Cobweb

Un esquema simplificado de un algoritmo de clustering se muestra en la siguiente figura

Reconocimiento de Voz

Actualmente el Reconocimiento de voz es utilizado como comunicación entre humano y computadora. El agrupamiento de datos o clustering puede definirse como el método para clasificar o describir propiedades de un sistema a partir de un conjunto de datos adquiridos o representativos del sistema. La aplicación de estos algoritmos tiene como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iníciales por su posición privilegiada con respecto al total. El objetivo de la construcción de estos algoritmos es que permiten la identificación de los fonemas de personas a partir de variables que identifiquen los caracteres del sonido para un flujo continuo de ondas sonoras y silencios.

Reconocimiento de voz generalmente es utilizado como una interfaz entre humano y computadora para algún software.

Debe cumplir 3 tareas:

  • Pre procesamiento: Convierte la entrada de voz a una forma que el reconocedor pueda procesar.
  • Reconocimiento: Identifica lo que se dijo (traducción de señal a texto).
  • Comunicación: Envía lo reconocido al sistema (Software/Hardware) que lo requiere.

Componentes en una aplicación


WEKA

Es una herramienta de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para preprocesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático.

Las ventajas de Weka son:

  • Está disponible libremente bajo la licencia pública general de GNU.
  • Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma.
  • Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado.
  • Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.

Weka soporta varias tareas estándar de minería de datos, especialmente, preprocesamiento de datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque también se soportan otros tipos). Weka también proporciona acceso a bases de datos vía SQL gracias a la conexión JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos.

EJECUCIÓN DEL ALGORITMO

En primer lugar abrimos el algoritmo reconocimiento_voz.arff, luego hacemos clic en la pestaña Cluster


Luego en la sección cluster hacemos clic en el botón Choose y elegimos el método de clustering que deseemos

Finalmente hacemos clic sobre el botón Start para ejecutar el algoritmo de reconocimiento de voz con el método que hayamos elegido.

ANALISIS DE RESULTADOS DEL ALGORITMO RECONOCIMIENTO DE VOZ

Los algoritmos de clustering permiten clasificar un conjunto de elementos de muestra en un determinado número de grupos basándose en las semejanzas y diferencias existentes entre los componentes de la muestra.

Mediante la utilización de la herramienta Weka presentamos los siguientes resultados obtenidos de la misma, con K-medias y Cobweb en el algoritmo reconocimiento de voz.

Algoritmo K-medias

weka4

Scheme: weka.clusterers.SimpleKMeans -N 2 -S 10

Indica que el algoritmo se ejecuta con 2 clusters y con 10 semillas

Relation:     vowel

Nos muestra que la relación es vocal

Instances:    450

Existen 450 instancias

Attributes:   14

Existen 14 atributos

Test mode:    evaluate on training data

Modo de prueba es evaluado sobre datos de entrenamiento

weka5

Number of iterations: 10

El número de iteraciones es de 10

Within cluster sum of squared errors: 1121.82115943575

Suma de errores cuadráticos

Datos totales          Cluster# 0            Cluster# 1

(450)                      (216)                     (234)

Además se muestran los valores de los niveles de intensidad vocales en fase de entrenamiento por los hablantes Andres y Yesi pronunciando las sílabas hid, hud y had

Entrenamiento o Prueba Entrenamiento Entrenamiento Entrenamiento

Hablante Andres          Yesi          Andres

Sexo Masculino  Femenino     Masculino

Caracteristica 0 -3.5319       -3.8258       -3.2606

Caracteristica 1 1.9342        2.2366        1.6551

Caracteristica 2 -0.4023       -0.3065       -0.4908

Caracteristica 3 0.5794        0.4519        0.6971

Caracteristica 4 -0.2654        0.0385        -0.546

Caracteristica 5 0.6922        0.4786        0.8894

Caracteristica 6 0.0125        0.0126        0.0124

Caracteristica 7 0.346        0.0578         0.612

Caracteristica 8 -0.2987       -0.5759       -0.0428

Caracteristica 9 -0.1038        0.0949       -0.2872

Clase hid               hud              had

A continuación se muestran los valores y porcentajes de la agrupación de Instancias divididas en 2 Clusters:

Clustered Instances

0      216 ( 48%) En el Cluster 0 existen 216 instancias que corresponden al 48%

1      234 ( 52%) En el Cluster 1 existen 234 instancias que corresponden al 52%

Visualización del Cluster

Desde esta pantalla podemos generar múltiples gráficas eligiendo cualquier combinación de atributos para los ejes.

En este caso seleccionamos los siguientes atributos:

  • Nombres de los hablantes en el eje de las X
  • Numero de Clúster en el eje de las Y
  • Los valores de las clases coloreadas (had, hed, hid, hod, hud)
  • Diseño de las instancias por defecto
  • Jitter o variación promedio

Podemos interpretar en la gráfica que los valores de las clases se agruparon en 2 Clusters y en grupos de hablantes separados

En este otro caso seleccionamos los siguientes atributos:

  • Sexo en el eje de las X
  • Numero de Clúster en el eje de las Y
  • Los valores de las clases coloreadas (had, hed, hid, hod, hud)
  • Diseño de las instancias por defecto
  • Jitter o variación promedio

En ésta gráfica podemos observar que las sílabas pronunciadas por las personas del sexo masculino se ejecutaron en su gran mayoría en el cluster 1 excepto por algunos casos como por ejemplo la clase had que ha sido pronunciada por personas del sexo femenino que se encuentran en el cluster 1.

Y análogamente a esto podemos observar que las sílabas pronunciadas por las personas del sexo femenino se ejecutaron en su gran mayoría en el cluster 0 excepto por algunos casos como por ejemplo la clase hud que ha sido pronunciada por personas del sexo masculino que se encuentran en el cluster 1.

Cobweb

weka8

A continuación se exponen algunos comentarios sobre la salida de arriba:

  • -A 1.0 -C 0.0028209479177387815 -S 42 especifica  parámetros agudeza y corte. Estos valores pueden ser especificados a través de la ventana emergente que aparece al hacer clic sobre el área a la derecha el botón Seleccionar (Choose).
  • Nodo N o hoja N representa un subcluster, cuya matriz es el grupo N.
  • La agrupación de estructura de árbol se muestra como un árbol horizontal, donde subclusters están alineados en la misma columna.
  • La raíz es el Cluster 0. Cada línea con un nodo de 0 define subcluster de la raíz.
  • El número entre corchetes después de nodo N representa el número de casos en la matriz el grupo N.

Visualización del Cluster

En este caso seleccionamos los siguientes atributos:

  • Nombres de los hablantes en el eje de las X
  • Palabras pronunciadas en el eje de las Y
  • Sexo coloreadas (masculino, femenino)
  • Diseño de las instancias por defecto
  • Jitter o variación promedio

weka9

Podemos observar que los fonemas son diferenciables en su pronunciación por todos los hablantes y en ambos sexos puesto que las instancias de un hed no se agrupan con un hud, las instancias de un hod no se agrupan con un had y así sucesivamente.

BIBLIOGRAFIA

Ene
10

Pues el título resulta un poco llamativo y espero no los defraude. Existen muchos programas que intentan burlar la seguridad de servidores tan populares como Megaupload y Rapidshare; sin embargo cada programa que sale sirve para un día y al siguiente ya no va más, o no sirve en lo absoluto… Es por esto que coloco ésta entrada que nace a raíz de unos comentarios antes instertados en algunas entradas del blog. Se trata de adquirir legalmente una Cuenta Premium, haciendo el pago de la misma mediante PAYPAL.

¿Cómo?


Pues bien, primero hay que crearse una cuenta en PAYPAL, “Premier Account” (cuando nos pida ingresar tarjeta damos a cancelar ya que no hace falta tenerla), pues es aquí donde recaudaremos nuestro dinero virtual para luego usarlo comprando nuestra cuenta o en lo que deseemos (ingresa datos reales ya que en esta cuenta se depositara tu dinero virtual y lo mas IMPORTANTE coloca tu correo electronico real)…


Listo, una ves creada nuestra cuenta en PAYPAL, nos dirigimos a este enlace: http://bux.to/?r=dspyder y clickeamos donde dice join now receiv… en la parte inferior izquierda de la página. Luego nos registramos colocando nuestros datos y el mail que usamos para nuestra cuenta en PAYPAL qué es donde recibiremos nuestro dinero virtual, en la casilla de referrer debe estar el nombre dspyder, si no lo esta colocalo tu…


Hecho todo esto, entran aquí: http://bux.to/login.php y ponen su usuario y contraseña y la serie de letras y numeros de la imagen para entrar en la página. Una vez que hayas ingresado abajo del “bux.to” gigante hay algunas opciones: Surf Ads, My Stats, How, etc… le das clic a “Surf Ads” y les va a aparecer una lista con varias direcciones en color gris. Abres una y esperas los 30 segundos de un contador que aparece en la parte superior de la página. Esto es lo mas importante, debes esperar hasta que el contador termine y se muestre la palabra DONE y un Check verde, Luego puedes cerrar esta pagina y comenzar con otra y así con todas una a una y no todas a la vez, porque sino no las contabiliza, puedes ir comprobando cuanto llevas acumulado si le das clic a “My Stats”.
Cuando acumulen 50 dólares, suficientes para abonar 1 mes de cuenta premium, se dirigen a “My Stats” y luego a “cashout”, de donde transfieren el dinero a su cuenta PAYPAL. Desde paypal ya pueden pagar una cuenta Premium para Rapidshare, Megaupload o gastar el dinero en lo que deseen, solo pueden retirar lo que lleven acumulado hasta que lleven $.50.00 o mas.

Requiere paciencia pero esta comprobado que sirve .


Por mucho tiempo se ha buscado como burlar a MegaUpload y Rapidshare para poder hacer nuestras descargas mas fáciles y cómodas, pero esto cada vez se hace mas trabajoso por las protecciones que pone MegaUpload y Rapidshare.
Así que al fin se optó por conseguir una Cuenta Premiun Gratis!

http://img526.imageshack.us/i/taxonomiav2.jpg/

Ago
11

Conocimiento Tácito: El conocimiento tácito consta comúnmente de hábitos y aspectos culturales que difícilmente reconocemos en nosotros mismos. En el campo de la gestión del conocimiento se hace referencia al conocimiento que únicamente la persona conoce y que es difícil explicar a otra persona (ejemplo: cómo montar en bicicleta).

Conocimiento Explicito: Se refiere al conocimiento susceptible de ser transmitido/expresado en un lenguaje formal y sistematizado. El conocimiento explícito representa tan sólo la punta del iceberg: “Podemos saber más de lo que somos capaces de decir”.

Conocimiento Tácito a Conocimiento Tácito (Socialización): Indica procesos de creación de conocimiento tácito. Este proceso implica participar de los conocimientos tácitos de cada individuo y se desarrolla compartiendo modelos mentales, aptitudes y habilidades; es decir, mediante la interrelación/ interacción.

Este proceso implica que cada individuo participe compartiendo modelos mentales, aptitudes y habilidades, mediante la interrelación/interacción.

Conocimiento Tácito a Conocimiento Explícito (Exteriorización): Indica procesos donde el conocimiento tácito es articulado en conceptos explícitos, de modo que sea expresado y traducido para ser comprendido por lo demás: requiere de procesos de comunicación. Este proceso se desarrolla a través del diálogo y la reflexión conjunta. Este modo es la llave para la creación de conocimientos puesto que genera conceptos nuevos y explícitos que emanan del conocimiento personalizado.

Conocimiento Explícito a Conocimiento Explícito (Asociación):

Indica procesos de sistematización de conocimiento explícito dentro de un cuerpo más amplio de conocimiento.

Supone la transformación de conocimiento explícito en formas más complejas, mediante la reconfiguración del ya existente, donde puede ser llevada a cabo actuando de diversos modos: clasificándolo, adhiriéndolo, combinándolo y/o categorizándolo.

Conocimiento Explícito a Conocimiento Tácito (Interiorización)

Supone la conversión del conocimiento explícito recién creado en un conocimiento tácito de cada individuo. Proceso de sistematización de conocimiento explícito.

El aprendizaje experimental o “aprender practicando y ejercitándose” permiten que este modo de conversión se lleve a cabo

En el medio que estudiamos, para mi criterio se desarrolla en conocimiento de Interiorización, de Conocimiento Explícito a Conocimiento tácito, por que se esta llevando a cabo más el aprender y practicar, todo conocimiento teórico se lo refuerza haciendo la práctica, así sabemos con ejemplos reales es como un entrenamiento de nuestros conocimientos.

Ago
11

Los diferentes métodos para construir el conocimiento dan lugar a los distintos tipos de conocimiento. Se pueden distinguir tres tipos esenciales de conocimiento: científico, artístico y revelado.

El conocimiento científico exige tres principios fundamentales:
1.Objetividad: el observador no debe (o intentará evitar en lo posible) alterar el fenómeno estudiado.
2.Inteligibilidad: el fenómeno estudiado debe poder ser representado de una forma más reducida (todo lo comprensible debe ser compresible). El azar sería una noción de la incompresibilidad.
3.Dialéctica experimental: el conocimiento científico es puesto a prueba por los experimentos. Si un conocimiento no soporta las pruebas es rechazado y reemplazado por otro que sí las soporte. El conocimiento científico es, por tanto, provisional.

Cuando nos encontramos ante un fenómeno de gran complejidad que somos incapaces de descomponer o ante el cual no sabemos establecer una relación causa-efecto, entonces podemos recurrir a los otros dos tipos de conocimiento.

El conocimiento artístico se apoya en el principio de comunicabilidad de complejidades initeligibles (teniendo en cuenta el significado atribuido a la palabra inteliglible). Por otro lado no necesariamente cumple el criterio de objetividad (aunque puede hacerlo). Además, el conocimiento artístico no necesariamente cambia.

El conocimiento revelado procede de un Sujeto para el que todo fenómeno es inteligible. Habría dos versiones de este tipo de conocimiento, una fuerte y otra débil. En la fuerte el sujeto que revela el conocimiento sería Dios, en la débil, la conciencia de uno mismo. No podemos decir nada acerca de la objetividad del conocimiento revelado, aunque si procede de un Dios podríamos presumir que es un conocimiento objetivo. Y por último, nótese que el conocimiento revelado necesariamente no cambia.

Jun
20

Plurk obliga, de momento, a visualizarlo a través de la web. Sin embargo, existen bots para las distintas mensajerías instantáneas e, incluso, una versión móvil con la que podremos crear un sencillo cliente. Plurk  aporta con respecto a Twitter una visualización basada en una línea temporal, respuestas a los mensajes, posibilidad de añadir contactos y seguirlos de modo independiente esta es una de las ventajas con respecto a Twitter), el karma (que nos permitirá ampliar el número de emoticonos e imágenes del servicio conforme vaya aumentando, algo en contra de lo que estoy), mostrar imágenes y vídeos embebidos en los mensajes y marcar como no-leídos los mensajes, con lo que tendremos un contador de los comentarios y actualizaciones pendientes por leer.

Plurk

Jun
18

Es bueno ser hincha de el mejor equipo del pais, y lo bueno es que lo ha demostrado en los ultimos 10 años, ganando 5 de los diez títulos disputados. Hoy es finalista de la Copa Libertadores, desarrollando una execelente campaña, esperemos que logre quedarse con el título y demostrar a muchos incredulos que el Ecuador y Liga no estan para cosas grandes…

Jun
07

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.