MIME-Version: 1.0 Content-Type: multipart/related; boundary="----=_NextPart_01D4EBFE.E66F4760" Este documento es una página web de un solo archivo, también conocido como "archivo de almacenamiento web". Si está viendo este mensaje, su explorador o editor no admite archivos de almacenamiento web. Descargue un explorador que admita este tipo de archivos. ------=_NextPart_01D4EBFE.E66F4760 Content-Location: file:///C:/2AC4594F/okP20V3N2Algoritmosdemineriadedatosparaelanalisisdelriesgo.htm Content-Transfer-Encoding: quoted-printable Content-Type: text/html; charset="windows-1252"
=
Data
mining algorithms for the analysis of phytosanitary disaster risk in the
municipality of Nueva Paz.
Ing. Adianys Gil Montero [1]=
span>,
Dr.C. <=
span
lang=3DES style=3D'font-family:"Times New Roman",serif;mso-fareast-font-fam=
ily:
Calibri;color:black'>Yasser Vázquez Alfonso [2]=
span> & Dr.C. Efraín Velast=
eguí
López[3]
Recibid=
o: 10-02-2019
/ Revisado: 15-02-209 /Aceptado: 04-03-2019/ Publicado: 04-04-2019
Disast=
er
is a function of the risk process and result of the combination of threats,
conditions of vulnerability and insufficient capacity or measures to reduce=
the
negative and potential consequences of the risk. Faced with these emergenci=
es,
studies of danger, vulnerability and risks of health disasters arise that t=
oday
play a very important role for all sectors, both in the international and n=
ational
community. This subject of considerable interest is the objective of this
research that allows the management of risk indicators of phytosanitary
disasters (epiphytic) in the municipality of Nueva Paz. A study was carried=
out
on the different dimensions of disaster risk, defining the technologies and
methodologies to be used in conjunction with mathematical and computational
algorithms using Data Mining techniques implemented through mathematical
algorithms: Apriori, J48, BsyesNet, Ridor , Multilayer Perceptron and
SimpleKMeans to analyze the information and thus discover trends and behavi=
ors
of the data and at the same time facilitate the process of decision making =
by
the specialists of the Nueva Paz municipality.
Keywor=
ds: phytosanitary Disas=
ter,
danger, vulnerability, risk, administration, epiphytic, mathematical
algorithms.
Resu=
men.
El desastre es función del pro=
ceso
de riesgo y resultado de la combinación de amenazas, condiciones de
vulnerabilidad e insuficiente capacidad o medidas para reducir las
consecuencias negativas y potenciales del riesgo. Ante estas emergencias su=
rgen
estudios de peligro, vulnerabilidad y riesgos de desastres sanitarios que h=
oy
en día juegan un rol muy importante para todos los sectores, tanto de la
comunidad internacional como nacional. Esta temática de considerable interés
constituye el objetivo de esta investigación que permite la gestión de los
indicadores de riesgo de desastres fitosanitarios (epifitias) en el municip=
io
Nueva Paz. Se realizó un estudio sobre las diferentes dimensiones que
contemplan los algoritmos de minería de datos para el análisis del riesgo de
desastre, definiéndose las tecnologías y metodologías a utilizar en conjunto
con los algoritmos matemáticos y computacionales mediante técnicas de Miner=
ía
de Datos implementadas a través de algoritmos matemáticos: Apriori, J48,
BsyesNet, Ridor, Perceptrón Multicapa y SimpleKMeans para analizar la
información y así descubrir tendencias y comportamientos de los datos y a su
vez facilitar el proceso de toma de decisiones por parte de los especialist=
as
del municipio Nueva Paz.
Palabr=
as
claves:
Desastre fitosanitario, peligro, vulnerabilidad, riesgo, gestión, epifitias,
algoritmos matemáticos.
Introducción
La Organización de las Naciones Unidas para la Agricul=
tura
y la Alimentación o FAO por sus siglas en inglés, plantea que la comunidad
internacional asiste hoy a un incremento sostenido de situaciones de desast=
res.
Entre ellos los de tipo sanitario, con un elevado costo económico, social y
ambiental que ponen en riesgo la sanidad humana, animal y vegetal sin desco=
ntar
las afectaciones a la producción sostenible de alimentos, amenazas que se
espera aumenten ante el cambio climático global(FAO,
2005).
Dentro de la clasificación de los desastres sanitarios
están: los que atacan al hombre o epidemias, los que atacan los animales o
epizootias y los que atacan las plantas o fitosanitarios. Estos últimos son
llamados Epifitias, que pueden ser causados por organismos o agentes nocivos
que constituyen plagas, enfermedades o malezas que en determinado nivel
poblacional producen daño económico a las plantas(Machado,
2007).
El creciente impacto en la economía mundial de
enfermedades y plagas transfronterizas exóticas ha colocado a los países an=
te
el reto de fortalecer sus capacidades defensivas para disminuir la
vulnerabilidad institucional, com=
o ha
sido reconocido por
organismos internacionales=
como
la Organización Mundial de la Sanidad Animal (OIE), la Organización
Mundial de la Salud (OMS) y la FAO(Percedo,
2006).
Internacionalmente destacan ot=
ras
instituciones como la Organización de las Naciones Unidas para la Cultura y=
las
Artes (UNESCO por sus siglas en inglés) que están relacionadas con esta
temática, realizan investigaciones y llevan a cabo proyectos con la finalid=
ad
de fortalecer la capacidad de los países(en los campos del uso de la
información técnica y científica y el desarrollo de metodologías
participativas) para la producción de información relacionada con la zonifi=
cación
de amenazas y riesgos, haciendo uso de los Sistemas de Información Geográfi=
ca
(SIG) que debe permitir mejorar la toma de decisiones para la reducción de =
los
desastres. El “Regional Action Program
for Central America” (RAPCA, por sus siglas en =
inglés)
está incluido en el Programa “Capacity Building for Natural Disaster Reduction” (CBND=
R por
sus siglas en inglés), ambos financiados por el Gobierno de Holanda y
administrados por la UNESCO. En América, de manera general, la creciente
necesidad de contar con una herramienta que facilite la gestión del riesgo =
ha
traído consigo la creación de diversos softwares que valgan como índice de
comparación y admitan un mejor alcance de la información entre políticos,
científicos y defensores del ambiente y de igual modo facilite la toma de
decisiones por parte de los directivos de los órganos de gobierno
ADDIN EN.CITE
<EndNote><Cite><Author>SENASICA</Author><Year>=
;2013</Year><RecNum>179</RecNum><DisplayText>(SENAS=
ICA,
2013)</DisplayText><record><rec-number>179</rec-number=
><foreign-keys><key
app=3D"EN"
db-id=3D"2asfpxd5efdermerfdmpxvrl5repax0parz9">179</key>=
</foreign-keys><ref-type
name=3D"Journal
Article">17</ref-type><contributors><authors><=
author>SENASICA</author></authors></contributors><t=
itles><title>La
Sanidad e Inocuidad en
México</title></titles><dates><year>2013</year&g=
t;</dates><urls><related-urls><url>http://www.pkeal=
imentos.gob.mx</url></related-urls></urls><access-date=
>enero
2017</access-date></record></Cite></EndNote>(SENASICA,
2013).
En Cuba las acciones para el
enfrentamiento a desastres sanitarios por enfermedades y plagas exóticas y
cuarentenadas (aisladas o apartadas) en animales y plantas, incluso por
epidemias en la población, se ejecutan según la Directiva No. 1 para la
Planificación, Organización y Preparación del País para Situaciones de
Desastres, del Consejo de Defensa Nacional (CDN)(CDN,
2005).
A nivel nacional se ha reforza=
do
la investigación e implementación de herramientas que contribuyan en esta
temática. Se desarrolló REDesastres, la primera red del sector agropecuario
nacional en este campo, la cual brinda soporte al trabajo del Centro de
Capacitación para la Reducción de Desastres Sanitarios en Animales y Plantas
(CEDESAP), adscrito al Centro Nacional de Sanidad Agropecuaria (CENSA) y
auspiciado por el Ministerio de Educación Superior (MES) y el Estado Mayor
Nacional de la Defensa Civil (EMNDC)(Percedo,
2008).
La idea de obtener información a partir de un conjunto=
de
datos no es nueva. Desde hace siglos, la gente ha tratado de entender cómo
extraer datos valiosos o útiles a partir de una colección de datos y luego =
cómo
hacer uso de la información obtenida para lograr un beneficio o un objetivo
útil siendo este el propósito de la minería de datos(Martínez,
2005).
La disciplina denominada Minería de Datos estudia méto=
dos
y algoritmos que permiten la extracción automática de información sintetiza=
da
que permite caracterizar las relaciones escondidas en la gran cantidad de
datos; también se pretende que la información obtenida posea capacidad
predictiva, facilitando el análisis de los datos de forma eficiente.
El departamento de Medio Ambiente del CITMA del munici=
pio
Nueva Paz no se encuentra ajeno a la necesidad de mantener su información
recopilada bien tratada y analizada al incorporar avances tecnológicos en
cuanto a automatización de procesos a través de la Minería de Datos, ya que
puede reportar grandes beneficios a las organización en cuanto en los EPVR
sobre todo al Estado Mayor Nacional de la Defensa Civil al explicar
problemáticas aparentemente aleatorias y abrir nuevos horizontes a la hora =
de
la toma de decisiones, además de garantizar el cumplimiento de estos estudi=
os
para la gestión de los indicadores de riesgos de desastres fitosanitarios y
recoger esta información por cada consejo popular, actividad que hasta hoy =
se
realizan manualmente en el departamento.
En la actuali=
dad el
CITMA del municipio Nueva Paz exige a cada consejo popular entregar los
resultados de los EPVR. Los indicadores del riesgo de desastre fitosanitario
recogidos de estos estudios son gestionados por los especialistas en el CIT=
MA
municipal manualmente apoyándose principalmente en el uso de hojas de cálcu=
lo
(Microsoft Excel) para almacenar los datos, que no están protegidas por un
control de accesibilidad con privilegios, dando cabida a que cualquier pers=
ona
pueda ver los datos que necesite y los que no, teniendo la posibilidad de
modificarlos sin autorización. La interpretación de los datos se realiza de
acuerdo a las experiencias de los especialistas y la manera en que estos los
entienden, lo que ralentiza el procesamiento de la información. Las
valoraciones son en la mayoría de las ocasiones acertadas, pero pueden estar
sujetas a errores subjetivos. Sucede además que en ocasiones se torna difíc=
il
acceder a los datos cuando se precisa de alguno en específico, pues están
contenidos en diferentes formatos.
Metodología
En la presente investigación se utilizó la información
proveniente de los EPVR (Estudios de Peligro Vulnerabilidad y Riesgo) desar=
rolladas
durante un año (2017) para la gestión de los indicadores de riesgos de
desastres fitosanitarios exigidos a cada consejo popular en el departamento=
de
Medio Ambiente del CITMA municipal de Nueva Paz, situado al extremo este
sudeste de la provincia Mayabeque, en los 22o46’ Lat. N y los 81o45’ Long. =
W,
limitando al Norte con el municipio de Madruga; al Este con el municipio Unión de Reyes, perteneciente a la provincia de Matanzas; al Sur con las aguas de la Ensenada de la Broa, en el
Golfo de Batabanó y al Oeste con el municipio de San Nicolás.
Para llevar a cabo el análisis=
de
los EPVR (especialistas de la dirección provincial de veterinarios, de la
agricultura, de la gestión del riesgo, de la defensa civil, de aprovechamie=
nto
hidráulico, de salud pública, de higiene y epidemiología, entre otros)
propuestos por el CITMA municipal de Nueva paz se tuvo en cuenta el “Índice
General de Riesgo Biológico”, que se calcula a partir de los siguientes
componentes:
Peligro: Constituidos por las plagas, entendiéndose como tale=
s,
cualquiera de las especies, razas, líneas o biotipos vegetales, animales o
agentes patógenos dañinos para las plantas o productos vegetales, que causan
perjuicio o que interfieren de cualquier otra forma en su producción,
elaboración, almacenamiento, transporte o comercialización
Vulnerabilidad de los OPB: Dada por las brechas sanitarias detectadas en la protección
fitosanitaria de los objetivos con riesgo biológico.
Se define como objetivo con
peligro biológico (OPB) el lugar o instalación donde concurren de forma
eventual o permanente, fuentes primarias o secundarias de plagas cuyo
desarrollo puede dar lugar a un desastre, y las posibles vías de dispersión
directa o indirecta de estas hacia la población vegetal potencialmente
expuesta.
Vulnerabilidad de la población vegetal:<=
span
lang=3DX-NONE style=3D'font-size:12.0pt;line-height:115%;mso-fareast-font-f=
amily:
Calibri;color:black'> Dada por los factores que la hacen más propensa al
impacto de un brote de plaga, por ser los elementos expuestos a ese peligro=
.
Al evaluar el peligro biológic=
o se
tienen en cuenta el factor país (FP), el factor local (FL) y se incluyen los
siguientes indicadores:
=
• =
La
identificación de las plagas que puedan dar lugar a una emergencia capaz de
desencadenar un desastre fitosanitario.
=
• =
La
clasificación de esas plagas según la probabilidad de ocurrencia de una
situación de desastre debida a su introducción y/o diseminación en el
territorio objeto de estudio (nación, provincia o municipio).
=
• =
La
identificación y caracterización de los escenarios de peligro y la evaluaci=
ón
de la probabilidad de su ocurrencia a través de métodos cualitativos y/o
cuantitativos.
Factor País: Vínculos comerciales,
medios de transporte, mercancías y personas, así como cercanía geográfica a
países afectados, entre otros. (Alto, Medio y Bajo)
Factor Local: Evaluac=
ión
del escenario de peligro según tipos de OPB existentes, relacionados con la=
s características
geográficas y las actividades económicas que en ellos se realizan (Alto, Me=
dio
o Bajo).
Para e=
ste
análisis del peligro de desastre fitosanitario se utilizaron las planillas y
tablas propuestas por la dirección del CITMA municipal de Nueva Paz que
facilitaron el desempeño durante todo el proceso, así como las formulas
diseñadas al respecto.
También
aportaron información estadística a este estudio, el Circuito de Guarda Bos=
ques
de Nueva Paz, la dirección de la Empresa Agropecuaria Nueva Paz y los planes
Municipales y Provinciales de producción facilitados por los organismos de =
la
agricultura de dichas instancias.
Este
estudio se llevó a cabo para 10 grupos de cultivos teniendo en cuenta 27 y =
16
plagas reglamentadas y no reglamentadas respectivamente ajustadas a las
especies establecidas en Lista Oficial de Plagas Reglamentadas y Plagas no
Reglamentadas de la República de Cuba vigente (2007).
A part=
ir
de las planillas para registrar los resultados de los EPVR orientados a la
población vegetal correspondientes al CITMA del municipio Nueva Paz se proc=
ede
a realizar el análisis de estos riesgos de desastres fitosanitarios a travé=
s de
la aplicación los algoritmos de minería de datos correspondientes a clasifi=
car,
agrupar y asociar tales como; Perceptrón Multicapa, SimpleKMeans, J48, A
priori, BayesNet y Ridor (implementados en Weka) con el objetivo de predeci=
r de
manera automatizada tendencias y comportamientos de la misma y responder a =
una
mejor toma de decisiones por parte de los especialistas en cuestión.
Resultados
El desarrollo de esta investigación cuenta con un sistema
informático que parte de una base de datos para almacenar toda la informaci=
ón
necesaria la cual contiene de forma digitalizada las planillas para registr=
ar
los resultados de los EPVR orientados a la población vegetal del municipio
Nueva paz. Utiliza, los algoritmos=
de
minería de datos Perceptrón Multicapa, SimpleKMeans, J48, A priori, BayesNe=
t y
Ridor (implementados en Weka) para el análisis de la información referida al
peligro, con el objetivo de predecir de manera automatizada tendencias y
comportamientos de la misma.
Las ventajas que aporta la
implementación de este sistema según los autores de esta investigación son:=
·<=
span
style=3D'font:7.0pt "Times New Roman"'> =
Facilita la recogida y validación de la información
relacionada con el análisis del riesgo de desastre y mejora de la calidad d=
el
dato, al eliminar el tratamiento manual de la información.
·<=
span
style=3D'font:7.0pt "Times New Roman"'> =
Permite mantener una alta disponibilidad de la
información, homogénea y actualizada, lo que ahorra tiempo y recursos a la =
hora
de analizar las métricas del negocio.
·<=
span
style=3D'font:7.0pt "Times New Roman"'> =
Posibilita el control y comunicación: La información
agregada es traducida a lenguaje de negocio y se hace visible y accesible a
todos los miembros de la organización.
·<=
span
style=3D'font:7.0pt "Times New Roman"'> =
Obviamente, cada usuario tendrá acceso y visibilidad
únicamente a la información que necesita.
·<=
span
style=3D'font:7.0pt "Times New Roman"'> =
Facilita la toma de decisiones para análisis del riesg=
o de
desastre fitosanitario en el municipio nueva paz.
A continuación, se muestran las
interfaces de inicio al sistema (figura 1 y 2), en las<=
span
style=3D'mso-spacerun:yes'> mismas se muestran imagines sobr=
e la
información proveniente de los EPVR obtenida a partir de planillas y tablas
propuestas por la dirección del CITMA municipal de Nueva Paz y según el “Ín=
dice
General de Riesgo Biológico”, que se calcula a partir de los componentes an=
tes
mencionados.
Figura 1: Interfaz de la página inicio al sistema.
Fuente: Elaboración propia
Figura 2: Interfaz de la página inicio al sistema.
Fuente: Elaboración propia
La figura 3 muestra la salida =
del
algoritmo Simple Kmeans, proporcionando al especialista conocer los parámet=
ros
que se tienen en cuenta durante el proceso de agrupamiento en este caso el
conjunto de instancias que no son más que los indicadores antes planteados =
que
se tienen en cuenta EPVR para analizar el riesgo de desastres fitosanitario
para estos 10 plantes con sus respectivas plagas reglamentadas o no
reglamentadas.
De ahí se precede a calcular la
distancia euclidiana de esta instancia y a partir de los clustering
seleccionados se procede a calculas sus controides
esta acción es repetida hasta que se encuentre la mayor de la
similitudes entre las instancias y se dé como conclusión los grupos
correspondientes.
Figura 3: Interfaz de la página Modelos de Agrupamiento (Métod=
o SimpleKMeans).
Fuente: Elaboración propia
La figura 4 muestra la salida =
del
algoritmo Simple Kmeans, proporcionando la asignación de instancias por gru=
pos,
pero en este caso visualizando graficas de pastel.
Figura=
4: Interfaz de la página Modelo=
s de
Agrupamiento.
Fuente: Elaboración propia
La figura 5 muestra la salida de uno de los algoritmos
utilizados dentro de los modelos de Clasificación para esta investigación en
este caso el método J48 por ser entre los modelos antes mencionados el mejor
clasificador para los datos analizados, proporcionando al especialista cono=
cer
los parámetros que se tienen en cuenta durante el proceso de clasificación =
como
son los casos correctamente clasificados, el índice estadístico Kappa que
refleja la coorcondancia de dichos indicadores que se interpreta que hay un=
acuerdo
máximo entre todos(1) si no (0 que no hay ).
La matriz de Confusión facilitara al especialista
comprobar o por lo menos obtener una probabilidad del conjunto de instancias clasifica=
das
según los indicadores de riesgo fitosanitario por cada una de las 10 plantas
reglamentadas o no teniendo en cuenta el factos pais=
span>
y el factor local todas estas clasificadas en alta media y baja según los
formularios, tablas y cálculos realizados para los EPVR. La figura 6 muestra además para este algoritmo su clas=
ificador
creando un árbol de decisión para predecir la clasificación. Los árboles de
decisiones a veces también se llaman árboles de clasificación cuando se
utilizan para clasificar valores nominales objetivos, o árboles de regresión
cuando se utilizan para predecir un valor numérico. Figura=
5: Interfaz de la página Modelo=
s de
Clasificación (Método J48). Fuente=
: Elaboración propia Figura 6: Interfaz de la página Modelos de Clasificación (Vista
del Árbol de decisión). Fuente=
: Elaboración propia. La figura numero 7 muestra la salida para el modelo de
Asociación a partir de una sus aplicaciones a través de las reglas de
asociación teniendo en cuenta el soporte para la toma de decisiones siendo =
este
el principal objetivo de la investigación, facilitar el análisis del riesgo=
de
desastre fitosanitario de los especialistas en el tema dentro del municipio
Nueva Paz. Lo que se brinda a los especialista con la salida de e=
ste algoritmo según los
datos de entradas es encontrar
asociaciones o correlaciones sobre un conjunto de datos ,en este caso entre=
los
indicadores analizados. Dicho de otra manera que
condiciones deben ocurrir para que se produzca cierta condición. Es decir q=
ue
es lo que ocurre tantas veces antes de, por ejemplo el método Apriori extrae un conj=
unto
de reglas de los datos y destaca aquellas reglas con un mayor contenido de
información. El proceso de evaluación de las reglas de asociación en
minería de datos se realiza de acuerdo a: La cobertura (soporte): Es el núm=
ero
de instancias para las cuales ella predice correctamente (soporte). La
precisión (confianza): Es el número de instancias que predice correctamente,
expresado como una proporción de todas las instancias a las que se aplica.<=
o:p> Figura 7: Interfaz de la página Modelos de Asociación (Método =
Apriori). Fuente: Elaboración propia Conclusiones En la investigación se arriba a
las siguientes conclusiones:
Referencia bibliográfica
AMA (2012). Propuesta de metodología para la realizac=
ión
de los estudios de peligro, vulnerabilidad y riesgos de desastres
fitosanitarios en la agricultura, 28 de junio, La Habana, Cuba.: Agencia de
Medio Ambiente (AMA), p.80.
CDN (2005). Direc=
tiva
No. 1 del Vicepresidente del Consejo de Defensa Nacional para la Planificac=
ión,
Organización y Preparación del País para Situaciones de Desastres., 1ro de
junio, Ciudad de La Hbana, p.30.
FAO (2005). =
El
cambio climático puede incrementar el número de víctimas del hambre. Comité=
de
Seguridad. Alimentaria Mundial, 26 de mayo, Roma, Italia, s.l.: s.n.=
MACHADO (200=
7). Manual
para la preparación comunitaria en situaciones de Desastres., Rodas: Edicio=
nes
Damují, Cuba.p.170..
MARTÍNEZ, B.
B.(2005). Minería de Datos. Tesis en
opción al título de Licenciado en
Ciencias de la Computación. Facultadad de Ciencias de la Computación.
Universidad Autónoma de Puebla.México. 67p.
PERCEDO (200=
6).
ESTRATEGIA PARA LA REDUCCIÓN DE DESASTRES SANITARIOS EN LA POBLACIÓN ANIMAL=
EN
CUBA. EL CASO DE LA INFLUENZA AVIAR., Mayabeque, Cuba: Rev. Salud Anim. Vol=
. 28
No. 3: 174-181.
PERCEDO (200=
8).
CEDESAP y REDesastres. Una contribución a la preparación y gestión
intersectorial y multidisciplinaria, San José de las Lajas, La Habana, Cuba=
.:
Veterinaria Organización.
SENASICA (20=
13).
La Sanidad e Inocuidad en México. Disponible en https://www.gob.mx/senasica/, Consultado el 20 de enero
2019.
Para
citar el artículo indexado.
=
Gil A,
Vázquez Y. & Velasteguí E.=
(2019)
=
El artículo que se
publica es de exclusiva responsabilidad de los autores y no necesariamente
reflejan el pensamiento de la Revi=
sta
Ciencia Digital.
El
articulo queda en propiedad de la revista y, por tanto, su publicación parc=
ial
y/o total en otro medio tiene que ser autorizado por el director de la Revista Ciencia Digital.
[1]Universidad
Agraria de la Habana, Facultad de Ciencias Técnicas, Mayabeque, Cuba, adianys@unah.edu.cu
[2]=
span>Universidad
de la Habana, Facultad de Turismo, La Habana, Cuba, yasser@ftur.uh.cu
[3]=
span>Revista
Ciencia Digital, Ambato, Ecuador, luisefrainvelastegui@cienciadigital.org
www.cienci=
adigital.org
Vol. 3, N°2, p. 30=
6-318,
abril - junio, 201