11 June 2008

BABYLON DICTIONARY – A HANDY TOOL FOR NEWBIES AND PROFESSIONALS

If you are a professional translator or work with languages in another capacity, then you might as well use dictionaries almost every day. Dictionaries are not only reference aids but also tools of work in the linguists’ hands.

With the rise of computers and the Internet, the hard-copy reference materials are gradually being replaced by electronic counterparts or even more enhanced versions of the old books. Thus the translator’s efforts to look up words and terms in several volumes of different dictionaries are spared and shifted to a single point of reference.

One of the most popular dictionary tools currently available is Babylon (http://www.babylon.com/). This is not a dictionary proper but an environment for working with some of the leading dictionary products on the market today.

Besides its dictionary features, Babylon also provides currency and measurement conversions, machine translation engine, and a spell-checker for emails, instant messaging and blogs. These functionalities, however, won’t be the subject of this post.

SEARCH WITHOUT TYPING

The most unique feature which makes Babylon stand out amongst the crowd of computer dictionaries is its OCR technology. This means that when you read a document or surf the web, or just see any text on the PC screen, you can simply click your mouse button over a word which you want to check and the Babylon window pops up and initiates a look-up in the configured bunch of dictionaries. You don’t need to type anything – the application recognizes the respective word and types it for you in the search field. (Of course, you can type the words/phrases by yourself, like in a conventional dictionary application.)

The developers went a step further by extending the search functionality, enabling Babylon to automatically include the surrounding words in the search query. To illustrate this, please have a look at the picture below:



In the text I’m reading there is a phrase “feasible target payout ratios” which I want to look up. Hovering over the word “ratio”, I click the mouse scroll button (This is my personal setup; other users may set it up differently). Babylon starts searching a definition for the word “ratio” but finds that its dictionary databases contain definitions not only for “ratio” but also for “payout ratio”, and even for “feasible target payout ratios”. The software proposes the respective results from any lexical databases where it appears.



What I found here very convenient is Babylon’s feature of searching and suggesting terms present not only in the dictionaries I have already configured to use but also in the dictionaries available in the large online database offered on Babylon’s website. So, if I’m satisfied with the definition of the term in a particular dictionary, I can easily add it to my bookshelf for further searches by simply clicking on the “+” (plus) sign in the dictionary title bar. In this way, your stock of working dictionaries gradually enlarges, thus ensuring better hits in future searches.

PREMIUM CONTENT

Another great asset offered by Babylon Ltd is its stock of premium dictionaries. If you go to http://www.babylon.com/ and then to the menu Add Dictionary > Premium Content, you are offered dictionaries issued by renown publishing houses (Oxford, Merriam-Webster, Britannica, Larousse, PONS, Langenscheidt, to mention few of them). However, their content here is provided not as hard copy but in an electronic form, enabled to be installed in and searched by the Babylon dictionary application. I have noticed that the company continually expands this list, including more and more dictionaries. These dictionaries cover some of the most popular languages used on the Internet – English, French, German, Spanish, Portuguese, Italian, Japanese, Dutch, etc.



DICTIONARIES BY BABYLON LTD.

Apart from the so-called “Premium” dictionaries, Babylon Ltd. also offers a multitude of free online dictionaries, glossaries, encyclopedias, and other reference databases. These are neatly categorized by topics. If we stick to linguistic content, we will be happy to find out that Babylon offers its own proprietary dictionaries covering a wider range of language pairs (go to http://www.babylon.com/gloss/glossaries.php, then Languages category, Babylon sub-category): from English to Arabic, Chinese (Simplified), Chinese (Traditional), Dutch, English, French, German, Greek, Hebrew, Italian, Japanese, Korean, Portuguese, Russian, Spanish, Swedish, Turkish, and vice versa. These are very comprehensive dictionaries (for example the English-English pair containing the total of 161,892 entries) which use a morphology search engine that can recognize words in their different grammatical or spelling forms. They are offered free of charge to users who buy the Babylon application.



USER DICTIONARIES

The third type of content that can be used with Babylon is the dictionaries created by users. They can be found at the Categories web page (http://www.babylon.com/gloss/glossaries.php).

In fact, one can easily compile their own glossaries to be loaded and used in Babylon side by side with the renowned Premium dictionaries. This can be done with the help of a separate application (provided free of charge by Babylon Ltd.) – Babylon Glossary Builder (version 3.1.0). The lexical data must be prepared beforehand in an Excel spreadsheet and then imported and converted to a .bdc file format. The downside of this additional tool is that it is not very straightforward and must be tweaked to get the desired results. The previous version of this application (namely Babylon Builder v. 2.2) was much more in line with Babylon’s strengths – namely, ease of use and intuitive functionalities.

From the perspective of language professionals, the possibility to create user (or any custom) dictionaries is one of the major strengths of the Babylon application in general. Premium content mostly supplies generalist dictionaries. What a professional translator needs in his/her daily work is narrowly specialized content – e.g. glossary of electrical engineering, bilingual automotive dictionary, and the like. Because such products have not been provided by Babylon Ltd. yet, the professional user can rely on the community efforts and sharing initiatives.



While browsing through the list of categories, I noticed that most of the user dictionaries were created 5–6 years ago and very few are added recently. I don’t know what the reason for this drop is, but Babylon Ltd. must definitely do something to urge the users create and upload their content in order to sustain the interest not only of users with small to medium linguistic needs but also of professional translators.

MY WISH LIST

What I would like to see in the future versions of the dictionary application is a better control of the search options – e.g. implementation of wildcard searches and better ways to restrict language pairs in a particular search query. The feature I’m missing the most is, let’s call it, enhanced “fuzzy searching”. In other words, when I activate the appropriate option the dictionary will give me all headwords that contain the word searched. This means that when I look up for “tax”, I’ll be provided with the definitions of the terms “corporate tax”, “tax advisor”, “tax return”, “capital gains tax”, etc. (i.e. the word “tax” appearing in combinations with other words in the entries). This feature is very useful in the translation work because oftentimes a term has an identical or similar meaning as used in another phrase. The translator is thus given additional information how the term is employed in other combinations.

THE BOTTOM LINE

Judging from my experience as translator, Babylon dictionary has the most user-friendly interface and maybe the richest lexical content gathered in a single application I have ever seen. I believe that it can meet the needs not only of a general computer user but also of professional translators and linguists. The great stock of quality dictionaries and the option to create your own (user) glossaries makes this application a powerful and highly customizable tool that is worth to be considered when selecting a computer dictionary.

Labels: , , , ,

25 May 2007

Romania's EU Commissioner Engaged to Promote Bulgarian Language in EU

Romania's EU Commissioner Leonard Orban, in charge of multilingualism has taken a serious engagement to promote the Bulgarian language and the Cyrillic alphabet in the EU, he himself announced Thursday.

Five months after Bulgaria joined the EU, the Bulgarian language has an even better position in the EU than the languages of the other member states, Orban said after his meeting with the country's EU Affairs Minister Gergana Grancharova.

Bulgaria will support Commissioner Orban's initiative and efforts to reduce and weaken the language barriers, Minister Grancharova said.

Orban, arrived on a one-day visit to Bulgaria on May 24, the day of the Bulgarian Education and Culture and Slav Letters.

Commissioner Orban joined the solemn festivities in Sofia and conferred with Prime Minister Sergey Stanishev. He is also met Education Minister Daniel Vulchev and Sofia mayor Boyko Borissov.

Source: http://www.novinite.com/

21 March 2007

Писмени преводи: до къде стигнахме след приключване на петото разширяване?

MEMO/07/76
Брюксел, 23 февруари 2007 г.

За по-малко от три години официалните езици на Европейския съюз се увеличиха повече от два пъти, като станаха от 11 на 30 април 2004 г. на 23 на 1 януари 2007 г. Генералната дирекция „Писмени преводи“ (ГДПП) на Европейската комисия прие смело това изключително предизвикателство, включвайки за 32 месеца повече езици от предходните 46 години.

През подготвителния период на присъединяването група лингвисти от страните кандидатки преведоха и редактираха достиженията на правото на Общността – приблизително 90,000 страници, които съдържат договори и вторично законодателство, приети до деня на присъединяване – понастоящем повече от 300 тома законодателство на Общността, всеки от по 300 страници. В Брюксел и Люксембург бяха наети и обучени нови преводачи, които да се присъединят към колегите си от „по-старите“ държави-членки.

С успешното интегриране през 2007 г. на български, румънски и ирландски език в разрастващото се семейство на официалните езици на ЕС, Европейската комисия показа още веднъж, че вместо да бъдат пречка за изграждането на по-тесен съюз между народите, езиците всъщност укрепват европейския проект и че страховитите предсказания на евроскептиците бяха напълно необосновани.

Разширяванията през 2004 г. и 2007 г.

Разширяването през 2004 г. бе разбира се огромно предизвикателство. Единадесет държави с девет нови езика станаха едновременно членове на Съюза. Както може да се очаква, преводът на достиженията на правото на Общността, създаването и функционирането на отделите на новите езици в Люксембург отнеха известно време, но повечето проблеми бяха бързо разрешени.

На 1 май 2004 г. Съветът прие, по искане на малтийските власти, дерогация, съгласно която за период от три години, считано от тази дата, Европейският съюз няма да публикува всички законодателни актове на малтийски език в Официален вестник на ЕС и може да се ограничи само до превода на актове, приети съвместно от Европейския парламент и от Съвета. Тази дерогация изтича на 1 май 2007 г.

Освен малтийският, всички останали нови езици изравниха позиции с постарите езици в ГДПП.

Предвид придобития от предишното разширяване опит, ГДПП извърши нужната подготовка за безпроблемното интегриране на българския и румънски език от 1 януари 2007 г. Първите български и румънски преводачи в ГДПП бяха назначени като договорно нает персонал още през януари 2006 г., за да подготвят необходимата инфраструктура и преводачески инструменти. Съобразно хода на процедурите за набиране на временен персонал, до присъединяването на новите държави-членки в ГДПП, както и в местните й служби в София и Букурещ, работеха повече от 30 преводачи за всеки език.

Приблизително 150 други успешно преминали конкурса преводачи са в списъка на подбраните кандидати за всеки от тези езици. От тези общодостъпни за всички институции списъци в близките месеци ще бъдат наети още преводачи. През първата половина на 2007 г. ГДПП следва да бъде в състояние да постигне целта си от 56 преводача за всеки езиков отдел.

Български език

Към 1 януари 2007 г. в ГДПП работят общо 31 български преводачи, назначени като договорно нает персонал. Целта е да се назначат още 25 преводачи до 1 март 2007 г. Все пак, това зависи от редица променливи величини, като продължителността на административните процедури и необходимостта от подаване на предизвестия.

В началото на месец март към вече назначените четири асистента трябва да се присъединят други четирима издържали конкурса кандидати. Остават още три свободни места.

Румънски език

Към 1 януари 2007 г. в ГДПП работят общо 40 румънски преводачи, назначени като договорно нает персонал. Целта на ГДПП е да се назначат още 16 преводачи до 1 март 2007 г. Както при българския език, крайният резултат зависи от ред променливи величини.

Четири асистента са назначени като договорно наети служители, скоро ще бъде нает още един асистент, а други шест места са все още свободни.

Случаят с ирландския език

Договорът за създаване на ЕО е достъпен на ирландски език още с присъединяването на страната през 1973 г. Все пак едва през 2005 г. ирландските власти поискаха ирландският език да получи статут на официален език на ЕС. Преводите на и от ирландски започнаха на 1 януари 2007 г. след приемането на регламент. Поради дерогация подобна на тази, поискана от малтийските власти, през петгодишния преходен период само регламентите, приети съвместно от Европейския парламент и от Съвета, и кореспонденцията от и с гражданите ще бъдат превеждани на и от ирландски.

ГДПП създаде отдел по писмени преводи за ирландски език и откри междуинституционален конкурс за набиране на персонал през 2006 г. Ирландското правителство носи отговорността за превода на останалите достижения на правото на ЕС.
Преводите на ирландски език ще започнат с работен екип от пет преводача. Набирането на персонал с ирландски език е особено голямо предизвикателство, като се има предвид ограниченото предлагане и нуждата от такива преводачи, която изпитват самите ирландски власти. Въпреки това, на 1 януари 2007 г. бяха назначени 1 преводач, 1 асистент и 1 ръководител. Втори преводач започна в началото на февруари, а трети се очаква скоро. Последните двама преводача се очаква да започнат работа в рамките на няколко месеца, докато екипът достигне пълния си капацитет.

В списъка с резерви има 19 кандидати, успешно издържали конкурса за писмени преводачи с ирландски език.

Регионалният език на Испания

През декември 2005 г. Комисията сключи административно споразумение с Испания относно използването на баски, каталански и галисийски езици в кореспонденцията с Комисията. Споразумението се основава на заключенията, приети от Съвета през юни 2005 г. относно разрешаване използването на регионални езици в Европейските институции, които имат статут на официални езици в райони от територията на държава-членка. Испанското правителство назначи служба за преводи от тези три езика на испански и обратно.

Генерална дирекция "Писмени преводи“ на Комисията

Специализирани преводачески служби съществуват във всички важни институции и органи на Европейския съюз -Комисията, Съвета, Европейския парламент, Европейския икономически и социален комитет и Комитета на регионите, Съда на Европейските общности, Сметната палата, Европейската централна банка, Европейската инвестиционна банка и Европейския омбудсман.

Генералната дирекция „ Писмени преводи“ (ГДПП) на Европейската комисия е най-голямата, основната й преводаческа задача е ясно свързана с „правото на инициатива“ на Комисията в законодателството на Общността и с ролята й на наблюдател. С общ брой персонал от 2350 души (1750 преводачи и 600 души помощен персонал) ГДПП отговоря на нуждите на Комисията за превод и езикови консултации по отношение на всички видове писмена комуникация.

ГДПП е почти по равно разделена между Брюксел, където се намират повечето отдели на „старите“ езици, и Люксембург, където са отделите на новите езици и някои отдели, които превеждат на 11-те езика преди разширяването през 2004 г.

Поради организационни причини ГДПП е разделена на езици, със самостоятелен езиков отдел за всеки официален език. Езиковите отдели са разделени по-нататък на звена, специализирани в различна тематика.

В рамките на езиковите отдели преводачите специализират в превода на документи от отделни области на политиките на Европейската комисия: селско стопанство, конкуренция, финансови и парични въпроси, образование и култура, трудова заетост, енергия, околна среда, външни отношения, регионална политика и много други.

През 2006 г. ГДПП преведе 1 541 518 страници, което е с 36 % повече от 1996 г. От тях 72 % бяха написани на английски (45 % през 1997 г.), 14 % на френски (40 % през 1997 г.) и по-малко от 3 % на немски (5 % през 1997 г.).

Около 20 % от страниците за превод бяха възложени на преводачи на свободна практика. Това разбира се прилага за документи, които не са законодателни, политически деликатни или много спешни.

ГДПП използва система за осигуряване на качеството, основана на класификацията на документите по категория. Всички преводи, които са предназначени за публикация, извършени от служителите на ГДПП или от външни преводачи, се редактират задължително. Преводи, поискани с цел информация или общо разбиране на текста, се редактират при необходимост.

Последователността в терминологията е гарантирана посредством използването на преводаческа памет и бази данни на основната терминология на Общността. За новите езици те започнаха да се създават при превода на достиженията на правото на Европейската общност.

През декември 2006 г. ГДПП прие нова стратегия с цел да се справи с разширяванията на Съюза и да контролира разходите, като в същото време гарантира оптимални стандарти за качество. Основните мерки включват разграничаване по приоритетност на основни и второстепенни документи, ограничения в дължината на документите и включване на езиковите въпроси при разработването на политики на Комисията. Други важни елементи на новия подход са преводът на интернет страници, намирането на равновесие между работата на вътрешните и външните преводачи и тясното сътрудничество между институциите на ЕС.

Контрол на разходите

През 2007 г. разходите за писмени преводи в Комисията възлизат приблизително на 302 милиона евро, което съответства на 0,63 евро на гражданин годишно. Благодарение на мерките, приети за ограничаване на заявките и подобряване на продуктивността, въвеждането на нови три официални езика не увеличи обществените разходите. През 2006 г. очакваната обща стойност на разходите за писмен превод във всички институции на ЕС се оценява приблизително на 800 милиона евро.

Превод не само на законодателни актове

За да се гарантира демократичност и участие в Европейския съюз, гражданите и заинтересованите лица трябва да имат интернет достъп до основната информация за дейностите на ЕС, преведена на официалните езици. Ето защо в допълнение на специфичните езикови отдели ГДПП създаде сега многоезичен отдел, специализиран в превода на интернет страници.

Специализирани преводачи помагат на други генерални дирекции не само в превода на съществуващите интернет страници, но също и в по-добро формулиране на посланието им и адаптирането му към новата среда.

Друго звено предлага за генералните дирекции стилистична редакция на текстове, често съставяни на английски и френски от лица, чиито майчин език е различен. При поискване, тези текстове се проверяват и ако е необходимо променят, за да се гарантира, че са правописно, граматически и стилистично правилни и лингвистично издържани, напр. достатъчно ясни да бъдат разбрани от съответните читатели или да бъдатпреведени на други езици.

ГДПП се доближи също непосредствено до хората, както бе предвидено в План Д за демокрация, диалог и дебат на заместник-председателя на Комисията Маргот Валстрьом. Понастоящем около 50 преводача работят в местните служби, установени в рамките на представителствата на Европейската комисия в столиците и главните градове на държави-членки. Те участват активно в комуникационната й политика и осигуряват контакти с преводаческата индустрия, преводаческата гилдия, гражданите и институциите и широката общественост.

За отбелязване на 50-годишния юбилей от подписването на Договора ГДПП ще организира състезания за превод за ученици с цел да насочи вниманието към важността на превода вСъюза.

С поглед в бъдещето

За преводачите, наети от новите държави-членки, ГДПП осигурява обучение на най-широко използваните езици (най-вече английски и френски) по отношение на информационно-технологичната среда и преводаческите инструменти на ГДПП, както и по отношение на тематиката, с която се занимава Комисията.

В дългосрочен план ГДПП насърчава създаването на Европейска магистърска програма по превод със стандартна учебна програма, която отговаря на потребностите на европейските институции, дружества и организации. Това ще бъде особено полезно в новите държави-членки и страните кандидатки, където програмите по превод все още не са напълно разработени.

Преводачи от ГДПП, които изучават нови езици, могат също да бъдат изпратени като „преводачи на разменни начала“ в университети на държави, където се говорят тези езици, с цел да подобрят уменията си и в същото време да дават уроци по превод и многоезичие в европейските институции.

Терминологичната дейност, извършена в европейските институции, е от голямо значение за хората, работещи също в държавите-членки. Ето защо междуинституционалната база данни „IATE“, съдържаща почти 1,5 милиона термини на различните езици, ще бъде скоро достъпна за широката общественост.

За превода на голямото количество документи, създадени от европейските институции, ГДПП прие и разработи някои от най-модерните технологии: от приложения за разпознаване на реч до компютърен превод, използвайки богат корпус или „преводаческа памет“, за да се гарантира последователността в преводите. Тези разработки допринасят също за прогреса на индустрията в областта на езиците в Европа.

За повече информация относно Генералната дирекция „Писмени преводи“: http://ec.europa.eu/dgs/translation/

Вижте също и портала „Езици“: http://europa.eu/languages/en/home

Labels: , ,

16 March 2007

Dictionaries and Termbases in the Same Boat

The process of converging the two different approaches of classifying linguistic knowledge - namely, lemma-based vs. concept-based - is going to bear fruit soon.

The project of TRADOS & Langenscheidt to implement Langenscheidt technical dictionaries in its translation memory system as MultiTerm termbases will soon come to the market.

The problem is that translators, in their everyday work, use both glossaries and paper-based/electronic dictionaries to check terminology. Merging the two sources will save time for researching and browsing in print or electronicmedia. Translators can thus refer simultaneously to dictionaries and termbases and easily compare internal terminology with standard dictionary translations.

The Langenscheidt project is probably one of the forerunners of an upcoming tendency to joing the products of translation memory/terminology tool providers and specialist dictionary publishers. They have the same target group but completely different approaches in data management and product marketing. Specialist dictionary publishers will have to act in the future as content providers for language tools in order to meet their actual needs.
For this reason, LexTerm is a bridge between lemma-oriented lexicography and concept-oriented terminology and a means for integration of lexicographical content in CAT tools such as Translation Memories.

So far, the total of 10 specialist bilingual Langenscheidt dictionaries in 100+ subject areas in the major European languages have been converted to be integrated in Translation Memory tools such as Trados’ Translators’workbench and which are believed to be on the market in 2007.

In this particular case, Langenscheidt dictionary content is converted into the native TRADOS MultiTerm exchange format. The content is then encrypted and write-protected to guarantee authenticity and write/copy protection.This safeguards the copyright of the publishing houses and their authors.The Langenscheidt dictionary can then be accessed (in read-only mode) like any other termbase in TRADOS MultiTerm.


I hope that the process of integrating dictionary content and electronic terminology/translation tools will take roots...

Labels: , , , , , ,

06 February 2007

Converter between Microsoft Office to OpenOffice format

The Open XML Translator is an Add-in to Microsoft Word (XP, 2003, & 2007) to allow opening and saving OpenDocument format (ODF) files. As a plug-in for Microsoft Word the tool provides the choice to open and save documents in ODF rather than the native Open XML format. The tool may also be plugged into competing OpenOffice that use ODF as default format.

The Open XML Translator has been tested on Microsoft Office 2007, Office 2003 and Office XP. In addition, Novell has announced that the tool will be natively implemented in its next version of OpenOffice.

Currently the tool only supports Word/Writer documents. Future releases will also serve Spreadsheet/Excel and Impress/Powerpoint formats.

This new tool/plug in is of special importance for professionals who work with different Document Formats, or whose clients provide one format while their tools support the other. In especially, the Open XML Translator allows professional translatorsand language service providers to use free and Open Source computer assisted translation (CAT) tools like OmegaT together with OpenOffice.

01 February 2007

Стаж по превод за студенти с английски език

Първият випуска английска филология (АФ) с преводачески профил към катедра "Англицистика и американистика" на СУ "Климент Охридски" ще завърши през юни 2007 г. В програмата е предвиден преводачески стаж в български институции, организации, редакции и др., който ще се проведе през последния семестър от тяхното следване през март-май 2007 г. Организациите, които желаят да приемат стажанти, могат да се обадят в катедра АФ, тел. 930-83-14, 946-30-93 или да изпратят електронно съобщение на адрес: min@tea.bg. Студентите от магистърската програмапо конферентен превод в СУ вече за трети път имат възможност да тренират уменията си по синхронен превод, като участват в работата на семинари.

25 January 2007

EU starts machine translation project for all EU languages

A press release from the German University Saarbrücken informs about EU plans to develop a machine translation system capable to translate all 23 languages.

Despite growing "legion of translators", the press release reads, "the general trend towards specialization, the demand on the competence of specialized translators also increases. This leads to a general increase in the cost of a good quality translation. The European Commission cannot, for example, send technical and legal translations among the languages of the European Union to the Philippines, India or other low-wage countries."

An new EU-funded project, called EuroMatrix, now aims at technological breakthroughs in automatic translation in order to combat the rising costs of the increasingly multilingual European society. New combinations of the best currently available methods for rule-based and statistical translation are to be tested. Additionally, the question of how statistical translation systems can be improved by linguistic methods will be investigated. The ambitious aim is to develop and test translation systems for the 23 official languages of the European Union. An important part of the project is also the organization of competitions among the best translation systems, to which all research centers and firms from Europe and other parts of the world are to be invited to participate. It will naturally not be possible to focus equally on each language pair, but a practical result of the project is to be a continuously updated assessment of the technological state for each language. This overview in the form of a large tabular matrix has given the project its name.

The project is coordinated by Professor Hans Uszkoreit at Saarland University. Dr. Philipp Koehn from the University of Edinburgh is serving as technical/scientific coordinator of the project. Other partners include internationally renowned research groups at Charles University in Prague lead by Prof Jan Hajic and the Evaluation Center CELCT in Trento under the direction of Prof. Amadeus Cappelli.

The partnership with representatives of industry is important for the success of the project: the German firm GroupWare AG is bringing their LOGOS system into the project, LOGOS being one of the largest and most important commercial translation systems, which was made available the year before last in an Open-Source version. The firm Morphologic in Budapest has developed digital dictionaries for many European languages and has its own translation technology.