Table Of Content

TFGENENGINYERIAINFORMA`TICA,ESCOLAD’ENGINYERIA(EE),UNIVERSITATAUTO`NOMADEBARCELONA(UAB) ´ PARALELIZACION DEL PROBLEMA DE ´ SATISFACCION DE RESTRICCIONES UTILIZANDO ARCO CONSISTENCIA Jordi Alcaraz Rodriguez Resum– El problema de satisfaccioń de restricciones se utiliza en varios campos de la informa´tica: Inteligencia Artificial, planificacioń de recursos, etc., y se considera NP-completo. A causa de la complejidad computacional de este problema es necesario utilizar buenas heur´ısticas y paralelismo para reducir el tiempo de co´mputo. En este proyecto se realizarań varias implementaciones pa- ralelasparamaximizarelusodelhardwaredisponibleyreducireltiempoderesoluciońdelproblema. Paraules clau– Problema de satisfaccioń de restricciones, computacioń paralela, Xeon Phi, a´rboldebu´squedaenprofundidad Abstract–InsomefieldsrelatedtoComputerSciencetheConstraintSatisfactionproblemisused,in exemple:ArtificialIntelligence,resourceplaning,etcetera,andthisproblemisNP-complete.Because of it’s computational complexity there is a need to use good heuristics and paralelism to reduce the time to solve it. In this project some parallel implementations will be performed to maximize the use oftheavailablehardwareandminimizethetimeneededtosolvethisproblem. Keywords– Constraint Satisfaction Problem, CSP, parallel computing, Xeon Phi, Depth-first search (cid:70) alnecesitargrancapacidaddeco´mputoparasuresolucioń. 1.1. Organizaciońdeldocumento 1 INTRODUCCIOŃ El resto del documento sigue la siguiente organizacioń: En los u´ltimos anõs los fabricantes de procesadores de- En la seccioń 2, “Estado del Arte”, se explicara´ el proble- cidieron dejar de incrementar la velocidad de reloj para maCSPy,tambień,desistemasymodelosparalelos.Enla aumentar el rendimiento. Este incremento ocasiona varios seccioń 3, “Objetivos”, se detallarań los objetivos de este problemas,elprincipaleselaumentodelconsumoenerge´ti- proyecto. Y en la seccioń 4, “Metodolog´ıa”, como se lle- co, el cual eleva la temperatura[1][2]. La solucioń adopta- ganacumplir losobjetivos.Enla seccioń5,“Desarrollo”, da fue cambiar la arquitectura de los procesadores, incre- sedescribeelalgoritmosecuencialylosmodelosutilizados mentandoelnu´merodenućleosdeejecucioń.Estecambio para paralelizarlo. En la seccioń 6, “Experimentacioń”, se afectaalosmodelosdeprogramaciońexistentesysurgela explicarańlosexperimentosrealizadosyelhardwareutili- necesidaddeprogramaciońorientadaasistemasparalelos. zado.Enlaseccioń7,“Resultados”,seexpondrańlosresul- Alaparecerunnuevomercadoorientadoalparalelismo, tadosobtenidosyserazonarań.Finalmente,enlaseccioń8, algunas empresas, como NVIDIA e Intel, desarrollan nue- “Conclusiones”,seresumirańlosresultadosdelproyecto. vos coprocesadores. Estos sistemas se basan en la utiliza- cioń de una mayor cantidad de nućleos de co´mputo, y son 2 ESTADO DEL ARTE aptosparaaplicacionesconungranniveldeparalelismo. Con el fin de analizar las mejoras e inconvenientes de Este apartado se divide en dos partes. Primero se expo- estosnuevossistemas,seutilizaraúnproblemadenominado ne el estado del arte del problema CSP y, para finalizar, el ProblemadeSatisfacciońdeRestricciones,conocidoconel estadodelartedelossistemasparalelos. nombredeConstraintSatisfactionProblema(CSP),elcual puede beneficiarse de este nuevo modelo de programacioń 2.1. ConstraintSatisfactionProblem E-maildecontacte:[email protected] En inteligencia artificial, y en otras a´reas de la compu- Mencio´realitzada:EnginyeriadeComputadors Treballtutoritzatper:JuanCarlosMoure(CAOS) tacioń, muchos problemas pueden ser vistos como proble- Juniode2015,Escolad’Enginyeria(UAB) 2 EE/UABTFGINFORMA`TICA:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃRESTRICCIONESCONARCOCONSISTENCIA mas de satisfaccioń de restricciones[3][4]. Los problemas 2.2. Sistemasparalelos desatisfacciońderestriccionessecomponende: Actualmente la mayor´ıa de ordenadores tienen procesa- Conjuntofinitodevariables,X={x ,x ,...,x }. dores con multiples nućleos de procesamiento. Con el fin 1 2 n deaprovechardemaneraeficientelosprocesadores,losal- Conjunto de Dominios de cada variable, D , D , ..., goritmossecuencialesdebendividireltrabajoarealizarde 1 2 D , donde cada dominio, a su vez, es el conjunto de manera eficiente entre los diferentes nućleos del sistema, n valoresposiblesdeunavariable. surgiendo la necesidad de nuevos modelos de programa- cioń. Conjunto de restricciones (Constraints) entre variables,C ,C ,...,C . 1 2 k 2.2.1. Procesadoresmulticoredepropo´sitogeneral Las restricciones son relaciones entre variables que limi- La arquitectura utilizada para paralelismo entre nućleos tan los valores va´lidos. Un ejemplo de restriccioń es All- deco´mputosedenominaMIMD(MultipleInstructionMul- different(X ,X ,...,X ),indicandoquecadavalordiferente tipleData).MIMDpermiteacadanućleoejecutardiferen- 1 2 n uńicamentepuedeasociarseaunavariable. tesinstruccionesadiferentesdatosdeformasimultańea. Una de las tećnicas ma´s utilizadas para la resolucioń de Paraincrementarelparalelismodentrodecadanućleode CSPs es la exploracioń en profundidad de un a´rbol de so- co´mputosecreoélprocesamientoSIMD(SingleInstruction luciones y volver a los nodos anteriores con backtracking. Multiple Data). El procesamiento SIMD, tambień conoci- Adema´s se utilizan tećnicas de poda (pruning) para limi- do como vectorizacioń, permite ejecutar la misma instruc- tarlacantidadtotaldeasignacionesdevaloresavariablesa ciońsobrediferentesdatosdeformasimultańeaenunuńico explorar[5]. nućleo.Lacantidaddedatosquepuedenserprocesadosde Este problema se considera NP-completo debido al cre- forma paralela, y que componen el vector SIMD, depende cimiento exponencialde ca´lculo necesariopara resolverel deltamanõdeloselementosdelvectorydeltamanõdelos problemaalaumentarelnu´merodevariables. registrosSIMDdelprocesador[7]. Un ejemplo sencillo de CSP es el problema de las N- Delamismamaneraqueenunprocesadorsepuedente- Reinas. Este problema consiste en colocar N reinas en un nermu´ltiplesnućleosdeco´mputounordenadorpuedetener tablerodetamanõNxNdemaneraqueningunapuedaatacar ma´sdeunprocesador.Lossistemasconvariosprocesadores aotra.Lacodificaciońutilizadaennuestraimplementacioń sedenominansistemasmultisocket.Debidoaestosepueden eslasiguiente: dividirlossistemasMIMDendosgruposseguńsuorgani- zaciońdememoria[8]: Variables,X={x ,x ,...,x }.Unavariableporcada 1 2 n reina y asignada a una fila. El valor de la variable x UniformMemoryAcces(UMA).Todaslasunidadesde i indicalacolumnadelareinadelafilai-e´sima. co´mputo del sistema comparten la memoria principal ytienenlamismalatenciam´ınima(sincolisiones)para Dominio comuń para todas las variable, D =(1, 2, ..., accederamemoria. 1 N).D =D =...=D . 1 2 n Non-Uniform Memory Acces (NUMA). En este caso Lasrestriccionessepuedenverenlafigura1ysonlas lamemoriaseencuentradistribuidaenbloquesycada siguientes: bloque asociado a uno de los diferentes procesadores del sistema. La latencia m´ınima (sin colisiones) para • Diferente-Columna(X , X , ..., X ). Todas las accederamemoriavar´ıaseguńelprocesadorquehaga 1 2 N variablesseasignanacolumnasdiferentes. la peticioń y el bloque que deba responder a la peti- cioń. Es la arquitectura utilizada con ma´s frecuencia • Diferente-Diagonal(X , X , ..., X ). Todas las 1 2 N porlossistemasmultisocket. variablesseasignanadiagonalesdiferentes. Enalgunosprocesadoresmulticore,Intelhaintroducido la tecnolog´ıa Hyper-Threading. Esta tecnolog´ıa permite a un nućleo de co´mputo ejecutar dos threads de manera si- multańea.Graciasatenerma´sdeunthreadejecutańdoseen elmismonućleoseaumentaelusodelosrecursosalpermi- tirejecutarinstruccionesdethreadsdiferentesqueesconden los tiempos de espera producidos por fallos de cache´ o de predicciońdesaltos,entreotros(Figura2)[9]. 2.2.2. CoprocesadorIntelXeonPhi Adema´sdelosprocesadoressepuedenutilizarcoproce- sadores para recudir el tiempo de ejecucioń de los progra- mas paralelos. El coprocesador creado por Intel recibe el nombredeIntelXeonPhiysedisenõ´ paraaumentarelren- Figura1:Reinaysusrestricciones[6]. dimientoenaplicacionesqueobtenganunabuenaescalabi- lidadenprocesaroresIntelXeon[10]. JORDIALCARAZRODRIGUEZ:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃDERESTRICCIONESUTILIZANDOARCOCONSISTENCIA 3 2.2.3. Modelosdeprogramaciońparalela Antesdehablardemodelosdeprogramaciońparalelase debe pensar en elos modelos de paralelismo a utilizar.En este proyecto se utilizarań los modelos de paralelismo de bucleydeparalelismodepareas. Enelmodelodeparalelismodebuclealllegarlaejecu- ciońaunbucleparalelosedividenlasiteracionesentrelos diferenteshilosdeejecucioń.Estemodeloutilizaelesque- madeparalelismoFork-Join.Elesquemaconsisteenejecu- tar el co´digo de manera secuencial hasta llegar a un punto concreto, donde se divide el trabajo en varias partes y se distribuyeentrediferentesthreads.Unavezhanacabadode trabajar todos los threads, la ejecucioń del algoritmo vuel- ve a continuar de manera secuencial, pudiendo haber ma´s divisionesdetrabajoenelfuturo(verFigura3). Figura 2: Sistema sin Hyper-Threading y sistema con Hyper-Threading. Se puede ver el efecto en el tiempo de ejecucioń de la posibilidad de esconder los tiempos de espera[9]. EL coprocesador Intel Xeon Phi dispone de una capa- Figura3:EsquemadeparalelismoFork-Join cidad de co´mputo siete veces superior a los procesadores XeonPhi[11].Adema´s,estamejoraseobtieneconunme- Encambio,enelmodelodetareas,unhilotrabajacomo jor rendimiento energe´tico. La capacidad de co´mputo del generador(llamadoMaster)yelrestoactuáncomoconsu- Intel Xeon Phi 7120P es de 1208 GFLOPS en doble pre- midores(llamadosWorkers).Algenerarseunatarea,lanue- cisioń,conunaeficienciade3.66GFLOPS/W.Encambio, vatareaseanãdeaunalistadetareas.Silosconsumidores el procesador Intel Xeon 2670 dispone de una capacidad acaban de ejecutar una tarea, o estań en espera, consultan deco´mputode166.4GFLOPS,conunaeficienciade1.45 la lista de tareas y, si no esta´ vac´ıa, se les asigna trabajo a GFLOPS/W. realizar(verFigura4). El coprocesador Xeon Phi cuenta con una arquitectura MIMDyutilizalosmismosmodelosdeprogramaciońque la CPU, facilitando as´ı la programacioń y adaptacioń del co´digo. A diferencia de los procesadores Xeon, de hasta 18 nućleosdecomputoy36hilosdeejecucioń,loscoprocesa- doresPhicontienenhasta61coresy244threads.Estohace queseamuyimportantelaescalabilidaddelasaplicaciones aejecutar. Otra diferencia es el tamanõ de los vectores SIMD. Mientras que el Xeon Phi permite instrucciones SIMD de 512bits,losprocesadoresXeondisponendeinstrucciones SIMDde256bits[12],siendoimportanteutilizardemane- raeficientelasunidadesSIMDdelPhiparaobtenerunbuen rendimiento. Sedisponededosmodosdiferentesdeejecucioń:ejecu- ciońnativa(elcomandosshpermiteconectarsealcoproce- sador y ver al Phi como un sistema independiente) y eje- cuciońoffload(modeloh´ıbridoquepermiteespecificarque´ partedelco´digoseejecutaenelhostyque´ parteseejecuta enelPhi). Elcoprocesadordisponedeunsistemaoperativobasado en Unix para poder gestionar la ejecucioń nativa y el sistema operativo necesita utilizar un nućleo. En ejecuciones offloadnosepermiteutilizaresenućleo,mientrasqueenlas ejecucionesnativassedisponedetodoslosnućleos,perose recomiendadejarunolibreparaelsistemaoperativo. Figura4:Esquemadeparalelismodetareas 4 EE/UABTFGINFORMA`TICA:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃRESTRICCIONESCONARCOCONSISTENCIA Entre los diferentes modelos de programacioń parale- 5.1. Ana´lisisdelalgoritmosecuencial la con soporte para tareas para el lenguaje C++ destacan Este algoritmo se utilizara´ para resolver el problema de por su popularidad [13]: Intel Threading Building Blocks, lasN-Reinas,codificadocomounproblemadesatisfaccioń OpenMP y Cilk Plus. El proyecto utilizara´ Cilk Plus y derestricciones.Elalgoritmosebasaenelrecorridodeun OpenMP, que estań integrados en los compiladores de las a´rboldebu´squedadesolucionesenprofundidadconback- ma´quinasdisponibles trackingyusandoarco-consistenciaparapodaralternativas. CilkPlusasignaunacoladetareasacadahilodeejecu- Las restricciones son binarias y el algoritmo utiliza opera- cioń (o worker) disponible, y reparte las tareas entre dife- ciones a nivel de bit para reducir la cantidad de memoria rentes colas. Los workers creados por Cilk Plus no se en- necesaria. cuentran ligados a un thread hardware y pueden migrar a El algoritmo al empezar selecciona la variable (var) 0 y otronućleodeprocesamiento.Cuandounhilodeejecucioń elnivel(level)0dela´rboldebu´squeda.Unavezacabadala sequedaconlacolavac´ıa,ylosdema´sno,seleccionaauna inicializaciońsellamaalafunciońdebu´squedadesolucio- v´ıctimapararobarletrabajo[14]. nes. Esta funcioń acepta de para´metros de entrada el nivel Porotrolado,OpenMPtieneunacolacompartidadeta- yelestadodelasvariables,ysiguelossiquientespasosdel reas. En el momento de asignar una tarea a un thread, se Algorithm1: entra en una zona cr´ıtica, la tarea es asignada y eliminada de la lista. Finalmente, el thread sale de la zona cr´ıtica y 3. Se comprueba si el estado (state) actual es va´lido. Si ejecutalatarea[15][16]. no es va´lido se devuelve 0, es decir, 0 soluciones en- contradas. 3 OBJETIVOS 4. Se comprueba si el nivel (level) es el ma´ximo permi- tido.Sielniveleselma´ximopermitidoyelestadoes Un objetivo principal de este proyecto es desarrollar e va´lido,tenemosunasoluciońydevuelve1. implementarunalgoritmopararesolverelproblemadelas N-Reinas, codificado como CSP, para sistemas con mu´lti- 5. Se selecciona una variable libre a la variable (var) a plesnućleosdeprocesamiento. utilizar. Otroobjetivoprincipalesevaluarycompararlosresulta- dosobtenidosutilizandodiferentesmodelosdeparalelismo 6. Seinicializaelcontadordesoluciones(s)a0. ydiferentessistemasparalelos. Adema´sdelosobjetivosprincipales,tambieńsepretende 7. Serealizanlossiguientesdospuntosporcadavalorde desarrollareimplementarunalgoritmoparaleloequivalente lavariable(var)seleccionada: aptoparaelcoprocesadorIntelXeonPhi. 8. Se calcula el nuevo estado (state´) con la funcioń de arc consistency. 4 METODOLOGÍA 9. Se llama recursivamente a la funcioń de bu´squeda de Conelfinderealizaresteproyectoseutilizo´ lametodo- soluciones, con los parametros de entrada del nuevo log´ıaWaterfall.Estametodolog´ıaseconsideraaptaparael estado(state´)yelnivelincrementadoenuno(level+1). proyecto al ser necesario el cumplimiento estricto de cada Ysesumaalcontadordecoluciones(s)lassoluciones unadelasfasesparapoderavanzaralasiguiente.Adema´s, encontradasporlafuncioń. estametodolog´ıaseutilizaenproyectosconobjetivosbien definidos al principio y con bajas probabilidades de sufrir 10. Sedevuelveelvalordelcontadordesoluciones(s). cambios,requerimientosquesecumplenenesteproyecto. En cada fase del proyecto con desarrollo de algoritmos Algorithm1Bu´squedadesoluciones sehacontadoconpruebasderendimientoyalfinalizarlas fasesdedesarrollodelosalgoritmosparaCPUserealizaron 1: procedureintsearch solutions(level,state) pruebasdeescalabilidad. 2: if!feasible(state)thenreturn0 Lasfasesdedesarrollodelproyectosonlassiguientes: 3: iflevel==N thenreturn1 4: var ←select free variable(state) Desarrollo del algoritmo paralelo con el esquema de 5: s←0 paralelismoFork-Join. 6: forval in available values(var,state)do 7: state(cid:48) ←arc consistency(var,val,state) Desarrolloutilizandoelesquemadeparalelismodeta- 8: s←s+search solutions(level+1,state(cid:48)) reas.Primeroparaelmodelodeprogramaciońparalela returns OpenMPydespue´sparaCilkPlus La complejidad del algoritmo es O(N!), donde N es el DesarrollodeversionesaptasparacoprocesadoresIn- nu´mero de reinas, esta complejidad se obtiene al tener N telXeonPhi. variablesconNvaloresperolosvaloreslibresalasignarun valoraunavariablesereducenenuno.Peroestacompleji- 5 DESARROLLO dadsereduceconsiderablementealutilizarenelalgoritmo tećnicasdepoda. Esteapartadosedivideenelana´lisisdelalgoritmoinicial La funcioń de arco-consistencia utiliza una lista de res- ylaparalelizaciońdelalgoritmo. tricciones binarias de tamanõ N3. Esta funcioń, por cada JORDIALCARAZRODRIGUEZ:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃDERESTRICCIONESUTILIZANDOARCOCONSISTENCIA 5 valordecadavariable,realizaNcomparacionesentrelalis- Paracadathreadsenecesitamemoriaadicionalpararea- ta y los valores de las dema´s variables, obteniendo un re- lizarlabu´squedaenelsuba´rbolquetieneasignado,aproxi- sultadoparalapoda.Debidoalascomparacionesarealizar, madamente(N2+3N)∗BitVector,dondeNeselnu´mero laarco-consistenciatieneunacomplejidaddeN3,yresulta dereinas. serlafunciońconunademandadetiempodeaproximada- Lasventajasdeestaimplementaciońsonlassiguientes: menteel93%deltotal. Faćilimplementacioń. EnelalgoritmosedefinelaestructuradedatosBitVector. Estaestructurasedefineparapodermodificareltamanõde Senecesitapocamemoriaextra. lasestructurasdedatosdecadareina,susdominios,lasres- triccionesbinariasylosvaloresdearco-consistencia,seguń Lasdesventajasson: elnu´merodereinas.Contaldereducirlacantidaddeme- morianecesariasetrabajaaniveldebityeltamanõdeBit- Paralelismo de threads limitado por el nu´mero de va- vectoresN +1bits,dondeNeselnu´merodereinas. loreslibresdelavariablesescogida. La lista de restricciones binarias es un cuello de botella Paralelismouńicamenteenlazonadelbucleparalelo. si el nu´mero de reinas es elevado, ya que el tamanõ de la listaenbyteses(N3)∗tamanõ de BitVector.Siseutiliza Malbalanceodecargaaltenercadaiteraciońcargasde un nu´mero pequenõ como 17 reinas el tamanõ de la lista trabajodiferentes. es 19,2 KBytes, pero en el caso de utilizar 200 reinas se necesitan 244,14 MBytes y si se requiere de 500 reinas se 5.2.2. Paralelizaciońmediantetareasparalelas necesitan7,5GBytes. Para hacer backtracking es necesario mantener los re- Enestaaproximaciońseintentaaumentarelparalelismo sultados previos de arco-consistencia obtenidos durante la ymejorarelbalanceodecargaenelprocesodebu´squeda. bu´squedaenela´rboldeposiblessolucionesyseutilizanN Lapartesecuencialdelalgoritmo,unavezllegaalnivel vectoresdebits(Bitvector)encadanivel.Conestefinseuti- a paralelizar, guarda en una lista la informacioń necesaria lizaunalistadetamanõ=(N2+N)∗sizeof(BitVector). parapodercontinuarconlabu´squeda.Cadavalordelalis- ta puede ser utilizado K veces, donde K es el nu´mero de 5.2. Paralelizaciońdelalgoritmo valores libres (ramas) de la Variable escogida a ese nivel. Despue´selprogramacreatantastareascomovaloreslibres Para poder paralelizar el algoritmo se ha dividido la tengalaVariableseleccionadaycontinuaexplorando.Asu bu´squedadesolucionesdelasiguientemanera: vez,losthreadsdisponiblesenelsistemaconsumenlasta- reascreadasdemaneraconcurrente,permitiendounmayor UnhilodeejecuciońllamadoMaster exploraela´rbol usodelosrecursosdisponibles. de bu´squeda de forma secuencial hasta una profundi- Enestemodelotambieńselimitaconunaregiońcr´ıticael daddeterminadaporelusuarioygeneratrabajo(con- accesodelavariablequecontieneelnu´merodesoluciones. tinuálabu´squedaapartirdelestadogenerado)parael Adema´s,sehaintroducidounanuevazonacr´ıtica,dondese restodehilos. evaluásielvaloractualdelalistasehautilizadoKveces, Ungrupodehilossedivideeltrabajogeneradoporel encasoafirmativoseutilizara´ lainformaciońdelsiguiente Master. valordelalista,dondeKeselnu´meroderamas. Deigualmaneraquelaestrategiaanteriornecesitabame- Primeroseexplicalaestrategiadeutilizarunbucleparalelo, moriaextra,e´stanecesitalamismamemoriaadicionalpor despue´s la versioń realizada mediante el uso de tareas y, thread.Peronecesitama´smemoriaparalosdatosqueutili- para finalizar, la versioń h´ıbrida para ejecutar el algoritmo zarańlastareas:sutamanõdependera´delosnodosexplora- enCPUyenelacelaradorXeonPhi. dosenelnivelseleccionado.Alutilizarpodanoesposible saber a priori el nu´mero de nodos explorados y se requie- 5.2.1. Paralelizaciońmedianteunbucleparalelo rehacerunaaproximaciońquereservama´smemoriadela En esta aproximacioń, al llegar la ejecucioń secuencial necesaria. aunniveldeterminadoporelusuario,unbuclerepartelos Enlaaproximaciońrealizadasiseutilizan17reinasyse valoreslibresdelaVariableseleccionadaentrelosdiferen- paraleliza a profundidad 3 se reservan 880 KBytes, de los teshilosdeejecucioń.CambiandoelbucledelAlgorithm1 cualesso´losonnecesarios732KBytes.Enelcasodepara- porunbucleparaleloenelnivelseleccionado,siguiendoel lelizaranivel6ladiferenciaaumenta,delos1135MBytes esquema de paralelismo Fork-Join (ver Figura 3). Debido reservadosso´losonnecesarios311MBytes.Losvaloresde a la poda irregular realizada en el a´rbol de bu´squeda cada lamemorianecesariaseobtienenalfinalizarlaejecuciońy threadtienecargasdetrabajodiferente.Lapartesecuencial mostrarcuantoselementosdelalistasehanutilizado. delalgoritmodebeesperaralafinalizaciońdetodaslasite- Lasventajasdeestaimplementaciońson: racionesdelbucleparaleloparapodercontinuar. El thread ma´ster no espera a los dema´s threads para Esta aproximacioń tiene una parte cr´ıtica: la actualiza- continuarsutrabajo. cioń del nu´mero de soluciones. Debido a tener varios th- readsejecutańdoseconcurrentemente,lavariablesepodr´ıa Mejor balanceo de carga al eliminar la necesidad de actualizardemaneraincorrectasiseleeyescribedemanera sincronizarencadanododela´rbolenelniveldondese concurrente. Para evitar tener un valor incorrecto se limita paralelizalabu´squeda. elaccesodeestavariableaunuńicothreadutilizandouna regiońcr´ıtica. Lasdesventajasson: 6 EE/UABTFGINFORMA`TICA:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃRESTRICCIONESCONARCOCONSISTENCIA Elusodememoriaextradependedelaprofundidada Hardware lacualseparaleliza. CPU Inteli7-950 Aolin №Nućleos 1socketx4=4cores Senecesitandoszonascr´ıticasenlugardeuna. №ThreadsH/W 4x2threads=8threads CPU IntelXeonE5645 5.2.3. Paralelizaciońh´ıbrida Aoclsd №Nućleos 2socketx6=12cores №ThreadsH/W 12x2threads=24threads Si se quiere utilizar el Xeon Phi como coprocesador las CPU IntelXeonE5-4620 anterioresestrategiasnosonaptas.Enelcasodelbuclepa- Penguin №Nućleos 4socketx8=32cores ralelo,allimitarelparalelismodethreadsalnu´merodeva- №ThreadsH/W 32x2threads=64threads loreslibres,seobtieneunacantidadinsuficientedetrabajas CPU AMDOpteron6376 independientescomparadoconelnu´merodethreadshard- Batman №Nućleos 4socketx16=64cores waredelPhi. №ThreadsH/W 64x1threads=64threads En cambio la estrategia de tareas resultar´ıa viable, pero CPU IntelXeonE5-2620 no hay soporte para consumir concurrentemente las tareas №Nućleos 2socketx6=12cores enelPhiyenelsistemahost. №ThreadsH/W 12x2threads=24threads Finalmente,sehaoptadoporutilizarelalgoritmodelmo- Sandman Coprocesor IntelXeonPhi7120 delodetareasperomodificarlodelasiguientemanera: №NućleosPhi 61cores Seintroducenloselementosenlalistadeinformacioń №ThreadsH/WPhi 61x4threads=244threads para las tareas, pero sin generar tareas. Se recorre de manerasecuencialela´rbolcompletolimitandolapro- Cuadro1:Hardwaredelasma´quinasutilizadas fundidadma´ximadeexploracioń. Sedeterminalacantidaddeelementosdelalistaaeje- dememoriaeslamismaparatodoslosnućleosdeco´mputo. cutarporelhostyporelcoprocesadorconelobjetivo En el caso de la ma´quina Aoclsd, que tiene de una arqui- derepartireltrabajo. tecturaNUMAperoduranteelperiododeexperimentacioń Se crea una zona paralela, en el host y el en Phi, al estabaconfiguradaconunaemulaciońdeUMA. finalizarlaparteseriedelalgoritmoyseconsumenlos Lasdema´sma´quinastienenunadearquitecturaNUMA: elementosdelalista. cadasockettieneunamemoriaasociadayaccederalame- moria asociada a otro socket incrementa el tiempo de res- Estemodelotienelosmismosrequerimientosdememo- puesta.Paraaprovecharalma´ximolascaracter´ısticasdees- riaquelaversiońconelmodelodetareas. tossistemasserealizaunaimplementaciońdelaversiońde Lasventajasdeestaimplementaciońson: tareasadaptadaasistemasNUMA,tandoconOpenMPco- mo con Cilk Plus. En esta nueva versioń la estructura de Buenbalanceodecargaenlaparteparalela datosautilizarporcadaworkerladeclaraelpropioworker Permite aumentar la capacidad de co´mputo al utilizar enlugardelthreadma´ster. elcoprocesadorXeonPhi. Todas las ejecuciones realizadas utilizan 17 reinas, me- nosenlasma´quinasAolin,queutilizan16reinas,debidoa El uso de memoria extra depende del nivel al cual se su menor capacidad de co´mputo y a utilizar un sistema de paraleliza. colasconunmenortiempoma´ximodeejecucioń. Doszonascriticas 7 RESULTADOS No hay paralelismo hasta finalizar la parte serie del algoritmo. Enesteapartadoseexplicarańlosresultadosobtenidosen diferentes ma´quinas y se extraerań conclusiones generales 6 EXPERIMENTACIOŃ delosresultados. Se debe tener en cuenta que la versioń con bucle para- Las experimentaciones con las diferentes versiones del lelo (llamada FOR en las gra´ficas) uńicamente se utilizara´ algoritmosehanrealizadoenlasma´quinasdelasiguiente enlacomputadoraAolindebidoasusdesventajasylimita- tabla(Cuadro1): ciones. Las ejecuciones del modelo de tareas, al utilizarse Todas las ma´quinas, menos Batman, disponen de pro- enlamayor´ıadegra´ficas,selasnombrara´ seguńelmodelo cesadoresIntelconHyperThreading,permitiendounautili- deprogramaciońparalelautilizado.SiendoOpenMPlaeje- zarinstruccionesindependientesdediferentesthreadspara cuciońdetareasconOpenMPyCilkPluslaejecuciońcon ocultar las esperas producidas por las latencias. Si el ren- tareasyCilkPlus. dimiento del algoritmo secuencial tiene problemas con esperas, por fallos de cache´ u otras latencias, utilizando dos 7.1. Resultadosinicialesderendimiento threads por nućleo se puede obtener una mejora de rendi- mientosuperioralnu´merodenućleosdeprocesamientodel Acontinuaciońseanalizaelimpactodeaumentarelni- sistema. vel del a´rbol a partir del cual se distribuye la bu´squeda en Lama´quinaAolin,aluńicamentedisponerdeunsocket, paralelo (ver Figura 5),. En estos experimentos se utilizan esdearquitecturaUMA,esdecir,lalatenciadelosaccesos ochothreads. JORDIALCARAZRODRIGUEZ:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃDERESTRICCIONESUTILIZANDOARCOCONSISTENCIA 7 HyperThreading,ejecutańdosedosthreadspornućleo(ver Figura 7). Se ha escogido paralelizar la bu´squeda a partir delnivel3alserelmejorparatodaslasversionesseguńla Figura5. Figura 5: Speed-Up respecto a la ejecucioń serie. El nivel var´ıaentre2y7. Se puede observar que la versioń con bucle paralelo Figura 7: Escalabilidad del rendimiento incrementando el en ninguń momento obtiene un rendimiento adecuado. El nu´merodehilosdeejecucioń. Speed-Upobtenidodesdelaprofundidad5nocompensael usodehardwareadicional.Estosedebealamalaestrategia quesigueelalgoritmoaltenerpartesdeco´digoserieymal Dados estos resultados, y los de la anterior gra´fica (ver balanceodecargaenlaszonasparalelas,desaprovechando Figura5),sepuedeafirmarquelaoptimizaciońqueparale- losrecursosdelprocesador(verFigura6).Otromotivodel liza con un bucle paralelo es la peor de todas sin importar malrendimientoeselincrementoenelnu´merodeinstruc- losrecursosutilizado.Estoesdebidoacarecerdesuficien- cionesparagestionarlasregionesparalelas. teparalelismoydeunbuenbalanceodecarga.Encambio, las versiones que utilizan un modelo de tareas son mucho ma´s eficaces, obteniendo un Speed-Up pro´ximo al nu´me- rodecoresutilizados.ConHyperThreadingelaumentode rendimientosuperaelnu´merodenućleosdelsistemaalma- ximizarelusodelosrecursosdeco´mputoescondiendolas latenciasdebidasazonascr´ıticasydependenciasdedatos. 7.2. Resultados de escalabilidad en sistemas multisocket En este apartado se analiza la escalabilidad en el rendi- Figura6:ProfilingconVTune.Cadafilacorrespondeaun miento de la implementacioń con el modelo de tareas. Se nućleodeco´mputo.Lasfranjasrojascorrespondenaespe- utilizansistemasconmu´ltiplessocketsyarquitecturasNU- ras,mientrasquelaszonasmarronesautilizaciońdeCPU MA. Para reducir la cantidad de figuras a mostrar se ana- lizanlosresultadosdelama´quinaPenguin(verFigura8), En el caso de las versiones de tareas el rendimiento no dado que los resultados son similares en las ma´quinas con var´ıa de manera significativa al variar la profundidad del procesadoresIntel,ylosdelama´quinaBatman(verFigura a´rbol de bu´squeda entre el nivel 2 y el 5. A partir del ni- 9). vel5CilkPluspierderendimientodemaneranotable.Esto En estas ejecuciones las computadoras Penguin y Bat- se debe a un incremento en el nu´mero total de instruccio- man tienen una arquitectura de memoria NUMA. Al uti- nes ejecutadas por el programa, llegando a un incremento lizar dicha arquitectura se debe tener en cuenta que la lo- del72.68%enelnivel7.Enteincrementovienegenerado calizacioń de los datos puede incrementar la latencia para principalmenteporlasfuncionesdeCilkPlusparagestionar accederamemoria.Contaldeminimizarlosoverheadsde lastareas.Parafinalizar,lape´rdidaconOpenMPsecentra memoriaesimportantequecadanućleodecomputoutilice en el nivel 7 a causa de tener menos trabajo los workers y lamemoriama´scercana. ma´s trabajo el hilogenerador. Elincremento en el nu´mero En el algoritmo del modelo de tareas el thread Master deinstruccionesenestecasotienepocoimpacto,alserdel crea,paracadanućleo,laestructuradedatosnecesariapara 5.37%. explorar los suba´rboles. En el caso de la versioń NUMA- En la Figura 7 se puede ver la escalabilidad del rendi- Awarecadanućleocrealaestructuradedatosensumemo- miento al utilizar un nu´mero creciente de threads. En los riama´scercanaaliniciarsecadathread. casosde2,3y4threads,cadaunodeellosseasignaaun SepuedevercomolaimplementaciońqueusaCilkPlus nućleo diferente, y en el caso de 8 threads se habilita el tienevariacioneslevesderendimientoentrelaversiońini- 8 EE/UABTFGINFORMA`TICA:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃRESTRICCIONESCONARCOCONSISTENCIA cial y la adaptada para NUMA. Gracias a que Cilk Plus disponedeunplanificadordina´mico,parabalancearmejor lacargaentrelosdiferentesnućleos,sepuedenmitigarlos efectosdelaarquitecturaNUMAdeformaautoma´tica,sin queelprogramadordebahacernadaespecial. Por otro lado, con OpenMP siempre es mejor la ver- sioń NUMA-Aware. A causa de no permitir migrar threads de manera automa´tica, seguń la localizacioń de los datos, los efectos de la arquitectura NUMA son considerables, y el programador tiene que optimizar el co´digo de forma expl´ıcitaparatrabajarenestasarquitecturasconOpenMP. En las dos ma´quinas con procesadores Intel (Figura 8) se ha llegado a conseguir un Speed-Up mayor al nu´mero de nućleos f´ısicos del sistema. Gracias a la tecnolog´ıa Hy- perThreading que ha conseguido maximizar la utilizacioń delosrecursosalesconderlatencias. ConlaarquitecturaAMD,enloscasosde8,16y32th- Figura8:EscalabilidadenPenguin.Con8threadsseutiliza reads,sehallegadoaunamejoraderendimientosuperioral unuńicosocket.De8a32threadsseutilizaunnućleopor incrementodehardwareutilizado(verFigura9).Encambio, thread.Con64hilosseutilizan2threadsporcore. al usar 64 threads, se pierde escalabilidad, y la utilizacioń delosrecursos,enlaversiońOpenMPNUMA-Aware,baja al85.6%. Hayquedestacarquelaarquitecturadelosprocesadores AMDorganizalosnućleosdeco´mputoenmo´dulosdedos coresydentrodelmo´dulosecompartendiferentesrecursos. Algunos de los recursos compartidos son las unidades de vectorizacioń, las unidades Fetch y Decode, y la cache´ de instrucciones,entreotras(verFigura10)[17][18][19][20]. Lascausasexactasdeestape´rdidanosonfaćilesdeen- contraralnodisponerdeunprofilercomoVTuneenarqui- tecturas AMD. Descartando los fallos de cache´ al obtener resultados similares con ejecuciones de 32 y 64 nućleos, y tambień problemas de vectorizacioń al realizar pruebas deshabilitandolasinstruccionesSIMDyobteniendomejo- rasderendimientosimilares,lascausasma´sprobablespue- den ser los tiempos de espera debidos a las zonas cr´ıticas delalgoritmoytambieńlasperdidasdebidasalosrecursos compartidosenlosmo´dulosdelosprocesadoresAMD. Figura 9: Escalabilidad en Batman. De 8 a 32 threads se Con la versioń Numa-aware de Cilk Plus el rendimien- utilizaunnućleodecadamo´dulodedoscores.Con64th- to ha empeorado, al contrario que la misma versioń con readsseutilizanlosdosnućleosdecadamo´dulo. OpenMP.LacausaprobableesqueCilkPlusespropiedad deIntelylaarquitecturaAMDpuedequenoseaadecuada paraestemodelodeprogramaciońparalela. 7.3. ResultadosXeonPhi Enesteapartadoprimerosemostrarańlosresultadosob- tenidos con el coprocesador Xeon Phi y el esquema de ta- reasconOpenMPNuma-Aware.Despue´ssemostrarańlos resultadosdelmodeloh´ıbrido. Las comparaciones de aumento de rendimiento se reali- zancontraelalgoritmosecuencialejecutadoenelhost. Sedebetenerencuentaquelasejecucionesqueutilizan elcoprocesadorXeonPhihanutilizadounnućleodeproce- samientomenosdelosdisponiblesdebidoalnućleoutiliza- doporelsistemaoperativodelPhi. Los resultados obtenidos con la versioń de tareas en el XeonPhi(verFigura11)permitenobservarco´moutilizan- Figura10:Unmo´dulodelaarquitecturaAMD[17] douńicamenteunhilodeejecuciońencadanućleodepro- cesamientoseobtieneunrendimientobajo,comparadocon utilizarelma´ximodethreadspermitidos,dondecasisecon- Teo´ricamente,enelXeonPhisepuedeobtenerunincre- sigueduplicarelSpeed-Up. mentodesieteveceslapotenciadeca´lculodeunXeonde JORDIALCARAZRODRIGUEZ:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃDERESTRICCIONESUTILIZANDOARCOCONSISTENCIA 9 8 nućleos. Esto se traduce en un Speed-Up de aproxima- damente56respectolaversiońserie,aunquesolamentese consigueun17.26(un30,8%delrendimientoteo´rico).Es- tosedebeenparteatenerunnu´meropequenõdereinas,se utilizanvectoriesSIMDdepequenõtamanõ,ynoseapro- vechaalma´ximolacapacidaddeSIMDdelPhi,quecuen- ta con vectores del doble de tamanõ que los procesadores Xeon. SisecomparanlosresultadosdelaFigura11ydelaFi- gura12sepuedeverunligeroincrementodelrendimiento entrelaversiońdetareasylaversiońh´ıbridaejecutańdose uńicamenteenelPhi.Estamejoraseobtienealejecutarla parteserieenunnućleodeprocesamientoma´spotente,per- tenecientealhost,consiguiendorecorrertodalaparteserie antesdequeelPhiconsigagenerarunnu´merodetareasque utilicedemaneraapropiadalagrancantidaddethreadsque Figura 12: Rendimiento de la versioń h´ıbrida comparada contiene. con la versioń secuencial en el host. El host es Sandman, La versioń h´ıbrida en el host tiene una pequenã pe´rdida conIntelXeonE5-2620v2.Encadacasoseutilizaelma´xi- derendimiento,del2,5%,respectoalaversiońdetareasen monu´merodethreadsquepermiteelsistema. el host. Esta pequenã diferencia se debe a tener una parte secuencialpequenãalparalelizaralnivel3. En la ejecucioń h´ıbrida se consigue llegar al 95.7% del neraumentosderendimientocercanoseinclusosuperiores aumentoderendimientoteo´rico,elma´ximoseobtienecon alnu´merodenućleosdeco´mputoutilizados. lasumadelaumentodelrendimientoenelhostyenelPhi EnelcasodeutilizarHyperThreadingelaumentoderen- (13,53 + 17,57 = 31,1). Este resultado se puede conside- dimientohasuperadolacantidaddenućleosutilizados,de- rarsatisfactorioalnohaberningunacomunicaciońentrelos mostrando que esta tecnolog´ıa cumple con la finalidad de dossistemasparabalancearcargadina´micamente. aumentarelrendimiento,aprovechandoinstruccionesdedi- ferentesthreadsparaminimizartiemposdeespera. ElcoprocesadorIntelXeonPhihapermitidoaumentarla capacidaddeco´mputodelsistemaperosuutilizaciońnoha sidoenlaproporciońesperada.Peseaseruncoprocesador faćildeutilizaryprogramar,sedebenllevaracabooptimi- zacionesenelalgoritmosisequiereobtenerunrendimiento o´ptimo.Conlosresultadosobtenidossepuedeafirmarque el problema de no obtener el Speed-Up esperado utilizan- doelPhirecaeenlaimplementaciońdelalgoritmoynoen los modelos utilizados, que obtienen buenos resultados de escalabilidad. 9 LÍNEAS FUTURAS Se pueden realizar varios cambios en el futuro. Estos cambiossonlossiguientes: 1. Limitar el nu´mero de tareas a ejecutar concurrente- Figura11:RendimientodelmodelodetareasenXeonPhi mente.Limitandoelnu´merodetareassepuedereducir comparadoconlaversiońsecuencialenelhost.Elhostes eltamanõdelalistaconlainformaciońdelastareas, Sandman, con Intel Xeon E5-2620 v2. Con 60 threads se reduciendolamemoriaextranecesaria. utilizaunthreadpornućleo,con120dosporcore,con180 tresycon240seutilizan4threadspornućleo. 2. UtilizarrestriccionesAll-Different,quesonma´srele- vantesparaelcampodelaInteligenciaArtificial.Este tipo de restricciones no necesitan de una lista con las restricciones,yrequierenmenostrabajodeco´mputoy 8 CONCLUSIONES menoscapacidaddememoria. Una vez finalizado el proyecto se puede comprobar que 3. Realizarunaimplementaciońsecuencialyunaversioń sehancumplidotantolosobjetivosprincipalescomoelob- paralelaequivalenteparalabu´squedadelaprimeraso- jetivosecundario,y,adema´s,laplanificaciońnosehavisto luciońodelasXprimerassoluciones. modificadaalolargodelproyecto,demostrandoquelame- todologiaWaterfallesadecuadaparaelproyecto. Realizandolasl´ıneasfuturas2y3sepodr´ıarealizaruna Los resultados obtenidos demuestran que los modelos implementacioń adecuada para ser ejecutada en GPUs y de paralelizacioń utilizados son adecuados para la resolu- tambieńparamejorarelrendimientodelXeonPhialtener cioń del problema de satisfaccioń de restricciones al obte- unmayornu´merodereinas. 10 EE/UABTFGINFORMA`TICA:PARALELIZACIOŃDELPROBLEMADESATISFACCIOŃRESTRICCIONESCONARCOCONSISTENCIA AGRADECIMIENTOS [14] Intel, “Faq: Cilk plus task scheduler.” https://www.cilkplus.org/faq/20, 2012. U´ltimo Megustar´ıaagradecerleamitutorJuancarlosMouresu acceso:25Abril2015. ayudaduranteeldesarrollodelproyectoysoportarmehasta sufinalizacioń. [15] K. A. H. y A. D. Malony y S. Shende y D. W. Ja- Quisiera tambień darle las gracias a Toni Espinosa y al cobsen, Integrated Measurement for Cross-Platform pequenõ grupito de alumnos de ma´ster y doctorado que OpenMP Performance Analysis. Using and Impro- mehanayudadoaresolverproblemasrelacionadosconlas vingOpenMPforDevices,Tasks,andMore,Springer, ma´quinasutilizadas. 2014. [16] X.T.yP.UnnikrishnanyX.MartorellyE.Ayduade´ REFERENCIAS yR.SilverayG.ZhangyE.Tiotto,OpenMPTasksin IBMXLCompilers.CASCON’08:proceedingsofthe [1] P. G. y M. F. Kowalik, Multi-Core Processors: New 2008ConferenceoftheCenterforAdvancedStudies WaytoAchieveHighSystemPerformance.PARELEC onCollaborativeResearch:meetingofminds,2008. 2006:ProceedingsoftheInternationalSymposumon ParallelComputinginElectricalEngineering,2006. [17] C.Angelini,“Amdbulldozerreview:Fx-8150getstes- ted.”http://www.tomshardware.com/reviews/fx-8150- [2] T. Spyrou, “Why parallel proces- zambezi-bulldozer-990fx,3043-3.html, 2011. U´ltimo sing? why now? what about my le- acceso:25Abril2015. gacy code?.” https://software.intel.com/en- us/blogs/2009/08/31/why-parallel-processing-why- [18] C. Webster, “Amd bulldozer - what’s a now-what-about-my-legacy-code, 2009. U´ltimo module, what’s a core?.” http://www.bit- acceso:7Marzo2015. tech.net/hardware/cpus/2011/10/12/amd-fx-8150- review/2,2011. U´ltimoacceso:25Abril2015. [3] V.Kumar,AlgorithmsforConstraintSatisfactionPro- blems:ASurvey. AIMagazine,vol.13,nº1,1992. [19] S. Walton, “Amd fx-8350 and fx-6300 piledriver review.” http://www.techspot.com/review/586-amd-fx- [4] E. Tsang, Foundations of Constraint Satisfaction. 8350-fx-6300/,2012. U´ltimoacceso:25Abril2015. London:AcademicPressLimited,1993. [20] M. Pollice, “Opteron 6300 series launch: An [5] S.C.B.yC.N.PottsyB.M.Smith,Constraintsatis- incremental upgrade on an outdated platform.” factionproblems:Algorithmsandapplications. Euro- http://www.vrworld.com/2012/11/05/opteron- peanJournalofOperationalResearch119,1999,557- 6300-series-launch-an-incremental-upgrade-on- 591,1999. an-outdated-platform/,2012. U´ltimoacceso:25Abril [6] H. Bodlaender, The rules of chess. 2015. http://www.chessvariants.org/d.chess/chess.html, 2000. [7] H. Bodlaender, M. McCool, A. D. Robison y J. Rein- ders. Waltham:MorganKauffmann,2012. [8] J. L. H. y D. A. Patterson, Computer Architecture: A QuantitativeApproachIV. MorganKauffmann,2007. [9] A. Valles, “Performance insights to intel hyperthreading technology.” https://software.intel.com/en- us/articles/performance-34insights-to-intel-hyperthreading-technology,2009. U´ltimoacceso:25Abril 2015. [10] J. J. y J. Reinders, Intel Xeon Phi Coprocessor High PerformanceProgramming.Waltham:MorganKauff- mann,2013. [11] Intel,IntroducingtheIntelXeonPhiCoprocessor,Ar- chitectureforDiscovery. 2012. [12] S.J.P.yC.J.HughesyM.SmelyanskiyyS.A.Jarvis, Exproring SIMD for Molecular Dynamics, Using In- telXeonProcessorsandIntelXeonPhiCoprocessors. IntelCorporation,2013. [13] A. L. y A. Gilman, A Comparative Analysis of Para- llelProgrammingModelsforC++. ICCGI2014:The Ninth International Multi-Conference on Computing intheGlobalInformationTechnology,2014.

Description:

la con soporte para tareas para el lenguaje C++ destacan por su popularidad [13]: .. “Faq: Cilk plus task scheduler.” https://www.cilkplus.org/faq/20, 2012. ´Ultimo acceso: 25 2008 Conference of the Center for Advanced Studies.

paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia PDF

13 Pages·2015·1.34 MB·Spanish

Checking for file health...

Save to my drive

Quick download

Download

Download paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia PDF Free - Full Version

by Unknow| 2015| 13 pages| 1.34| Spanish

Download paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia by in PDF format completely FREE. No registration required, no payment needed. Get instant access to this valuable resource on PDFdrive.to!

Free Download PDF

About paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia

Detailed Information

Author:	Unknown
Publication Year:	2015
Pages:	13
Language:	Spanish
File Size:	1.34
Format:	PDF
Price:	FREE

Download Free PDF

Safe & Secure Download - No registration required

Why Choose PDFdrive for Your Free paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia Download?

100% Free: No hidden fees or subscriptions required for one book every day.
No Registration: Immediate access is available without creating accounts for one book every day.
Safe and Secure: Clean downloads without malware or viruses
Multiple Formats: PDF, MOBI, Mpub,... optimized for all devices
Educational Resource: Supporting knowledge sharing and learning

Frequently Asked Questions

Is it really free to download paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia PDF?

Yes, on https://PDFdrive.to you can download paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia by completely free. We don't require any payment, subscription, or registration to access this PDF file. For 3 books every day.

How can I read paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia on my mobile device?

After downloading paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia PDF, you can open it with any PDF reader app on your phone or tablet. We recommend using Adobe Acrobat Reader, Apple Books, or Google Play Books for the best reading experience.

Is this the full version of paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia?

Yes, this is the complete PDF version of paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia by Unknow. You will be able to read the entire content as in the printed version without missing any pages.

Is it legal to download paralelizaci´on del problema de satisfacci´on de restricciones utilizando arco consistencia PDF for free?

https://PDFdrive.to provides links to free educational resources available online. We do not store any files on our servers. Please be aware of copyright laws in your country before downloading.

The materials shared are intended for research, educational, and personal use in accordance with fair use principles.