Universidad de Costa Rica
Escuela de Ciencias de la
Computación e Informática
|
|
CI-1322 Autómatas y compiladores
Traducción de avisos económicos de autos a XML
La base tecnológica sobre la que está contruida la
red Internet incluye el
HTML, el ancestro del
XML. Usted construirá su programa
"xcarx.exe
"
que tome páginas HTML de avisos económicos y
extraigan un documento en formato XML con la información
relevante al documento. Su programa debe ser capaz de extraer toda
la información de cada anuncio económico.
También debe manejar la codificación que es usual en
este tipo de avisos. Use las siguientes páginas Internet
para realizar su trabajo:
Después de analizar los avisos económicos, su
programa debe producir un documento XML altamente estructurado que
permita manipular con comodidad todos los avisos económicos
relevantes a vehículos automotores. No se limite a copiar el texto
de cada anuncio en un sólo renglón: examine palabra
por palabra cada anuncio para decodificar el significado. Por
ejemplo, en lugar de crear un documento XML que contenga este
renglón completo:
<ANUNCIO>
HYUNDAI 96, americana, azul, al día, airback, d/h, a/c. Tel:344-5177. 0000237654
</ANUNCIO>
su programa debe producir un documento similar a éste:
<add language="spanish">
<id>0000237654</id>
<class>auto</class>
<date>
<year>2007</year>
<month>03</month>
<day>12</day>
</date>
<brand>HYNDAI</brand>
<contact tag="phone">344-5177</contact>
<attribute>
<year>1996</year>
<value>americana</value>
<color>azul</color>
<value>al dia</value>
<value>airback</value>
<value tag="d/h">direccion hidraulica</value>
<value tag="a/c">aire acondicionado</value>
</attribute>
</add>
Entregue su tarea por
correo electrónico, como
lo hizo anteriormente.
Entrega de Tareas
Tiempo de entrega: |
3 días |
Entregue su documentación en la primera fecha, y
luego entregue el programa completo en la segunda fecha.
|
|
Segunda etapa: |
7 días |
Modalidad: |
En parejas |
Soluciones
Adolfo Di Mare <adolfo@di-mare.com>.
Copyright © 2008
Derechos de autor reservados © 2008