Download Free Programmation Dynamique Et Traitement Dimages Sur Machines Paralleles A Memoire Distribuee Book in PDF and EPUB Free Download. You can read online Programmation Dynamique Et Traitement Dimages Sur Machines Paralleles A Memoire Distribuee and write the review.

Nous étudions la mise en œuvre d'algorithmes parallèles sur des ordinateurs a mémoire distribuée. A travers plusieurs exemples issus de la programmation dynamique, de l'algèbre linéaire et du traitement d'images, nous exposons les problèmes lies a la programmation de ces machines: topologie d'interconnexion, stratégie d'allocation des données, équilibrage des calculs et minimisation du volume de communication inter-processeurs. Les exemples étudiés sont pour la plupart des algorithmes séquentiels couteux en temps de calcul et en place mémoire, et pour lesquels il est très intéressant d'avoir une parallélisation efficace. Nous avons choisi des problèmes dont l'implémentation sur des machines a mémoire distribuée n'est pas aisée, essentiellement a cause de la grande interdépendance entre les différentes taches composant les algorithmes
Cette thèse est consacrée à l'étude et à la conception d'algorithmes graphiques parallèles sur les machines MIMD à mémoire distribuée. Après une étude générale sur les architectures parallèles et la parallélisation des algorithmes graphiques, nous détaillons nos travaux qui ont porté sur plusieurs thèmes différents : l'implémentation d'un algorithme de reconstruction tridimensionnelle sur divers machines, à l'aide d'un module de communication PPCM que nous avons développé pour pallier à l'absence de tout langage et environnement standard sur les machines parallèles. Ensuite, deux algorithmes de visualisation des données volumiques ont été parallélisés. Le z-buffer est parallélisé de deux façons complémentaires sur un supernode. Dans la première approche, la scène est distribuée aux processeurs configurés en arbre. L'image est produite de manière pipelinée. Dans la deuxième approche, l'image aussi bien que la scène sont distribuées aux processeurs connectés en anneau. Une redistribution dynamique des objets est accomplie avant la projection des objets. L'implémentation parallèle d'un algorithme de visualisation directe est effectuée sur un hypercube IPSC860 avec un algorithme d'équilibrage dynamique de taches. Un nouveau modèle d'éclairage pour les données volumiques est également développé. Une discussion sur l'équilibrage des taches, la diminution du temps de communication est menée à la fin de cette thèse. Deux algorithmes de multi-distribution sur le réseau cycles connectés en cube sont développés au cours de cette étude. Les formules du temps d'exécution de ces deux algorithmes sont aussi fournies
LE THEME DE CE MEMOIRE EST L'ETUDE DE LA PARALLELISATION D'ALGORITHMES DE TRAITEMENT D'IMAGES. UNE OPERATION PARTICULIERE DU TRAITEMENT D'IMAGES EST RETENUE ET ETUDIEE EN DETAIL. LES ALGORITHMES EXISTANTS SONT COMPARES ET ANALYSES. L'ETUDE DE CETTE OPERATION EST ENSUITE REPRISE SOUS L'ANGLE DU PARALLELISME. LA PROCEDURE RETENUE EST CELLE D'AMINCISSEMENT D'IMAGE (OU THINNING). CETTE OPERATION EST BASEE SUR LA DEFINITION D'UN DESCRIPTEUR DE FORME DONNEE PAR H. BLUM EN 64. NOUS ABORDONS CE SUJET PAR LE BIAIS DE L'ALGORITHMIQUE PARALLELE. LA PROGRAMMATION DE MACHINES PARALLELES A MEMOIRE DISTRIBUEE ET A USAGE GENERAL EST NOTRE MODELE DE REFERENCE. DE NOUVEAUX OUTILS DE PARALLELISATION, AINSI QUE DE NOUVEAUX ALGORITHMES PARALLELES SONT PROPOSES. UNE ETUDE DE LA COMPLEXITE SEQUENTIELLE ET PARALLELE DU PROBLEME EST PROPOSEE
Dans le domaine de la synthèse d'images, le lancer de rayon est un algorithme permettant de prendre en compte divers effets lumineux. Cependant il présente l'inconvénient d'être extrêmement coûteux en temps de calcul. Le recours au parallélisme doit permettre de diminuer de façon significative le temps de calcul des images. Ce document présente une étude du problème de la parallélisation de l'algorithme du lancer de rayon. Après quelques rappels sur les domaines étudiés, synthèse d'images et parallélisme, suivis d'un état de l'art, une solution originale pour le problème de l'équilibrage de la charge de calcul des différents processeurs est proposée. Celle-ci, appelée méthode de rééquilibrage dynamique de la charge, repose sur la combinaison de deux types de parallélisme : parallélisme des données et parallélisme des tâches. La gestion de la répartition du travail entre les différents processeurs s'effectue de façon complètement dynamique, en cours de traitement. Bien que conçu pour toute une famille de machines parallèles, les réseaux de processeurs à mémoire distribuée, L'algorithme a été implanté sur un réseau de transputers. Des mesures de performances sont présentées et une comparaison est effectuée avec les solutions les plus performantes du moment.
Cette thèse vise à définir une méthodologie de mise en œuvre d'applications performantes sur les processeurs embarqués du futur. Ces architectures nécessitent notamment d'exploiter au mieux les différents niveaux de parallélisme (grain fin, gros grain) et de gérer les communications et les accès à la mémoire. Pour étudier cette méthodologie, nous avons utilisé un processeur cible représentatif de ces architectures émergentes, le processeur CELL. Le détecteurde points d'intérêt de Harris est un exemple de traitement régulier nécessitant des unités de calcul intensif. En étudiant plusieurs schémas de mise en oeuvre sur le processeur CELL, nous avons ainsi pu mettre en évidence des méthodes d'optimisation des calculs en adaptant les programmes aux unités spécifiques de traitement SIMD du processeur CELL. L'utilisation efficace de la mémoire nécessite par ailleurs, à la fois une bonne exploitation des transferts et un arrangement optimal des données en mémoire. Nous avons développé un outil d'abstraction permettant de simplifier et d'automatiser les transferts et la synchronisation, CELL MPI. Cette expertise nous a permis de développer une méthodologie permettant de simplifier la mise en oeuvre parallèle optimisée de ces algorithmes. Nous avons ainsi conçu un outil de programmation parallèle à base de squelettes algorithmiques : SKELL BE. Ce modèle de programmation propose une solution originale de génération d'applications à base de métaprogrammation. Il permet, de manière automatisée, d'obtenir de très bonnes performances et de permettre une utilisation efficace de l'architecture, comme le montre la comparaison pour un ensemble de programmes test avec plusieurs autres outils dédiés à ce processeur.
CETTE THESE EST CONSACREE A L'ETUDE ET A LA CONCEPTION D'ALGORITHMES GRAPHIQUES PARALLELES SUR LES MACHINES MIMD A MEMOIRE DISTRIBUEE. APRES UNE ETUDE GENERALE SUR LES ARCHITECTURES PARALLELES ET LA PARALLELISATION DES ALGORITHMES GRAPHIQUES, NOUS DETAILLONS NOS TRAVAUX QUI ONT PORTE SUR PLUSIEURS THEMES DIFFERENTS: L'IMPLEMENTATION D'UN ALGORITHME DE RECONSTRUCTION TRIDIMENSIONNELLE SUR DIVERS MACHINES, A L'AIDE D'UN MODULE DE COMMUNICATION PPCM QUE NOUS AVONS DEVELOPPE POUR PALLIER A L'ABSENCE DE TOUT LANGAGE ET ENVIRONNEMENT STANDARD SUR LES MACHINES PARALLELES. ENSUITE, DEUX ALGORITHMES DE VISUALISATION DES DONNEES VOLUMIQUES ONT ETE PARALLELISES. LE Z-BUFFER EST PARALLELISE DE DEUX FACONS COMPLEMENTAIRES SUR UN SUPERNODE. DANS LA PREMIERE APPROCHE, LA SCENE EST DISTRIBUEE AUX PROCESSEURS CONFIGURES EN ARBRE. L'IMAGE EST PRODUITE DE MANIERE PIPELINEE. DANS LA DEUXIEME APPROCHE, L'IMAGE AUSSI BIEN QUE LA SCENE SONT DISTRIBUEES AUX PROCESSEURS CONNECTES EN ANNEAU. UNE REDISTRIBUTION DYNAMIQUE DES OBJETS EST ACCOMPLIE AVANT LA PROJECTION DES OBJETS. L'IMPLEMENTATION PARALLELE D'UN ALGORITHME DE VISUALISATION DIRECTE EST EFFECTUEE SUR UN HYPERCUBE IPSC860 AVEC UN ALGORITHME D'EQUILIBRAGE DYNAMIQUE DE TACHES. UN NOUVEAU MODELE D'ECLAIRAGE POUR LES DONNEES VOLUMIQUES EST EGALEMENT DEVELOPPE. UNE DISCUSSION SUR L'EQUILIBRAGE DES TACHES, LA DIMINUTION DU TEMPS DE COMMUNICATION EST MENEE A LA FIN DE CETTE THESE. DEUX ALGORITHMES DE MULTI-DISTRIBUTION SUR LE RESEAU CYCLES CONNECTES EN CUBE SONT DEVELOPPES AU COURS DE CETTE ETUDE. LES FORMULES DU TEMPS D'EXECUTION DE CES DEUX ALGORITHMES SONT AUSSI FOURNIES
LA PROGRAMMATION DE CALCULATEURS PARALLELES DEDIES A LA VISION ARTIFICIELLE EST UN PROBLEME DELICAT SANS OUTIL ADAPTE A CET EFFET. L'UTILISATEUR EST ASTREINT A DECRIRE EXPLICITEMENT LE PARTAGE DES OPERATIONS ET LES COMMUNICATIONS INTER-PROCESSEURS. LES TRAVAUX PRESENTES DANS CE MEMOIRE SONT RELATIFS A LA CARACTERISATION DE METHODES DE PARALLELISATION D'APPLICATIONS DE TRAITEMENTS D'IMAGES POUR UNE MACHINE MIMD A MEMOIRE DISTRIBUEE DEVELOPPEE AU LASMEA: TRANSVISION. CES TRAVAUX SONT UNE ETAPE PRELIMINAIRE VERS LA DEFINITION D'UN ENVIRONNEMENT D'AIDE A LA PROGRAMMATION PARALLELE. CE MEMOIRE EST CONSTITUE DE 6 CHAPITRES. APRES UNE PRESENTATION DE MACHINES PARALLELES DE VISION, LE CHAPITRE 1 PRESENTE UNE TAXINOMIE DES OPERATEURS DE BAS ET MOYEN NIVEAUX. LE CHAPITRE 2 PRESENTE UNE CHAINE COMPLETE DE SEGMENTATION D'IMAGES AU SENS CONTOUR ET D'EXTRACTION DE GROUPEMENTS PERCEPTIFS DE SEGMENTS. CHAQUE ETAPE DE TRAITEMENT EST DECRITE PRECISEMENT. LE CHAPITRE 3 DECRIT LA PARALLELISATION DE CETTE CHAINE DE TRAITEMENTS, DECOMPOSEE SELON CINQ TACHES DE COMPLEXITE EQUIVALENTE. LA PARALLELISATION DE CHAQUE TACHE EST DECRITE AINSI QUE LA MISE EN UVRE DE L'INTEGRALITE DE CETTE APPLICATION. L'EXTENSION DU SCHEMA DE PARALLELISATION EST ABORDEE ET TROIS EVOLUTIONS POSSIBLES SONT PRESENTEES EN FIN DE CHAPITRE. LES CHAPITRES 4 ET 5 PRESENTENT DEUX AUTRES CHAINES DE TRAITEMENTS ET LES SCHEMAS DE PARALLELISATION PROPOSES POUR UNE MACHINE MIMD A MEMOIRE DISTRIBUEE. DANS LE CHAPITRE 6, NOUS PRESENTONS UNE SYNTHESE DES SCHEMAS DE PARALLELISATION ABORDES A L'OCCASION DE CETTE THESE