Правильные словари для ZBedic

kfetisov

relb писал(а):Как и обещал, вот:
Русско-Английский Королева 1.7M (md5)
Англо-Русский Королева 1.6M (md5)
Русско-Английский Сократ 564k (md5)
Англо-Русский Сократ 676k (md5)

Замечание по поводу Сократа.
На сколько я понял - это не полноценный словарь, а словарная база от одноименного переводчика. Словарных статей конечно много, но они очень маленькие (одно-два слова). Правда много словосочетаний. Но их и в Мюллере достаточно.
Это все мое IMHO. Так что если понравится - пользуйтесь.

А вот вопросик возник - а нельзя ли какие-нибудь русско-немецкие и наоборот словарики переконвертить?

С сибирским приветом,

Константин.

maravan

Ни один линк на словари не работает!!!
Выложите/пришлите пожалуйста .

maslovsky

maravan писал(а):Ни один линк на словари не работает!!!
Выложите/пришлите пожалуйста .

Словари есть в Cacko feed: http://cacko.biz/cacko/feed/

maravan

Спасибо!

fAX · Сообщение **fAX** » Пн май 09, 2005 05:32

Ожегов и БЭС кому-нибудь нужен? Правда, в последнем очень много статей пришлось на части порезать из-за ограничения в 16Кб/entry в xerox (индексатор словарей).

geometer

Нужны!!

fAX · Сообщение **fAX** » Ср май 11, 2005 04:08

Куда можно выложить?

Ожегов занимает 2537912 bytes.
БЭС занимает 13642495 bytes.

ВНИМАНИЕ! оба словаря работают только с ZBedic >= 0.95!!! (брать с http://sourceforge.net/project/showfile ... _id=321224 )

Могу выложить и "перловую" кашу, которую я набросал для этой цели. Делает почти всё, только нужно начало и конец подправить в текстовом редакторе, удалить мусор и комментарии.

svsleaves

fAX писал(а):Куда можно выложить?

Ожегов занимает 2537912 bytes.
БЭС занимает 13642495 bytes.

ВНИМАНИЕ! оба словаря работают только с ZBedic >= 0.95!!! (брать с http://sourceforge.net/project/showfile ... _id=321224 )

Могу выложить и "перловую" кашу, которую я набросал для этой цели. Делает почти всё, только нужно начало и конец подправить в текстовом редакторе, удалить мусор и комментарии.

Очень хочется.
Может в cacko feed найется место?

fAX · Сообщение **fAX** » Чт май 12, 2005 12:53

словарь Ожегова (2479 кб)
Большой энциклопедический словарь (13321 кб)

У меня нет постоянного хостинга, поэтому выкладываю на webfile. Поэтому все, кому нужны эти словари, пожалуйста, заберите их поскорее.

В выходные почитаю, как делать .ipk и постараюсь выложить также и в этом формате, чтобы можно было в feed его положить.

На всякий случай, выкладываю и скрипт для трансформации из stardict'овских словарей.

dict2zbedic.pl
Usage:

Код: Выделить всё

./dict2zbedic.pl <unzipped input dictionary> <unzipped output dictionary> -x <full path to xerox executable> [-s <split size>] [-n <name>]

Example:

Код: Выделить всё

./dict2zbedic.pl ozhegov myozh.dic -x '../zbedic/libbedic/objs.x86/xerox' -s 7000 -n Ozhegov

split size не должен превышать 16000
name лучше присвоить английское, по крайней мере, utf-8 zbedic в списке не отображает.
Полученный .dic файл лучше ужать dictzip'ом (dictzip myozh.dic)
И это... код писан на коленке, не судите строго

Код: Выделить всё

#!/usr/bin/perl -w

# author: Pavel Gurevich aka fAX
# license: GPL v2.

use strict;
use Getopt::Long;

use vars qw ( $opt_xerox
              $opt_name
              $opt_counter
              $opt_split
              $opt_cut
            );

&GetOptions ("-xerox|x=s",
             "-name|n=s",
             "-split|s=i",
             "-counter|c=i",
             "-cut"
            );

my $begin = 0;
my $input = shift @ARGV;
my $output = shift @ARGV || 'output.dict.dz';
my $lfcounter = 0;

my $tmp = "/tmp/dic2zbedic";
my $name = $opt_name || "generated dictionary";
my $prev_word = '';
my $desclen = 0;
my $counter = 0;
my $word_cnt = 1;
$opt_counter ||= 5000000;
my $split = $opt_split || 15000;


my ($word, $description);

open ( INPUT, $input ) || die "Cannot open input file '$input': $!\n";
open ( TMP, ">$tmp" );

input: while ( <INPUT> ) {
  chop;
  m/^$/ && do {
    ++ $lfcounter;
    if ( $word && $description ) {

#      $word =~ m/^#/ && do { last; };
      if ( $word ne $prev_word ) {
#        print TMP "{/s}\000" if ( $prev_word );
        print TMP "\000$word\012";
        $desclen = 0;
        $word_cnt = 1;
      } elsif ( $opt_cut ) {
        next;
      }

      $desclen += length $description;
      if ( $desclen > $split ) {
        if ( $opt_cut ) {
          print TMP "{s}{ss}" . substr ( $description, 0, $split ) . "...{/ss}{/s}";
          $description = '';
          $desclen = 0;
          next input;
        } else {
          print TMP "\000$word  ($word_cnt )\012";
          ++ $word_cnt;
        }
        $desclen = 0;
      }

      while ( length $description > $split ) {
        my ( $desc ) = substr ($description,0,$split,'') . "...";
        print "Splitted $word\n";
        $description = "..." . $description;
        print TMP "\000$word ($word_cnt )\012";
        print TMP "{s}{ss}$desc\{/ss}{/s}";
        ++ $word_cnt;
        if ( $opt_cut ) {
          $description = '';
          $desclen = 0;
        }
      }
      print TMP "{s}{ss}$description\{/ss}{/s}";
      $prev_word = $word;
      $word = '';
      $description = '';
      ++$ counter;
      last if ( $counter > $opt_counter );
    }
    next;
  };

  if ( $lfcounter >= 4 ) {
    $begin = 1;
    print TMP "id=$name\012";
    print TMP "description=This dictionary was created using dict2zbedic.pl from file '$input'\012";
  }

  if ( !$begin ) {
    $lfcounter = 0;
    next;
  }

  if ( $lfcounter > 0 ) {  # Word
    $lfcounter = 0;
    s/^\s*//;
    $word = $_;
    next;
  } else {
    $description .= $_;
    next;
  }
}
print  TMP "\000";
close ( TMP );
my $command = "$opt_xerox  $tmp $output";
( system( $command ) >> 8 ) && die "Error running '$command': $!\n";
unlink $tmp;

[/list][/url]

maslovsky

fAX писал(а):словарь Ожегова (2479 кб)
Большой энциклопедический словарь (13321 кб)

У меня нет постоянного хостинга, поэтому выкладываю на webfile. Поэтому все, кому нужны эти словари, пожалуйста, заберите их поскорее.

В выходные почитаю, как делать .ipk и постараюсь выложить также и в этом формате, чтобы можно было в feed его положить.

Отлично! Обязательно добавлю словари в feed.

DMych · Сообщение **DMych** » Чт май 12, 2005 15:47

Если есть среди завроводов эсперантисты, на http://bedic.sourceforge.net/ выложен Universala Vortaro.
В скором времени сделаю еще пару словарей (Эсперанто-русский Бокарева и Komputada Leksikono Покровского).

fAX · Сообщение **fAX** » Чт май 12, 2005 18:17

maslovsky писал(а): Отлично! Обязательно добавлю словари в feed.

Если бы кто дал ftp, куда закачать, я бы все словари с mova.org поконвертил со временем. Я ещё чуть поправлю скрипт, чтоб комменты оригинальные оставлял, а то некрасиво получается.

Да! Я опечатался, скрипт конвертит словари формата DICT, не StarDict!

Vladimir_P

DMych писал(а):Если есть среди завроводов эсперантисты

Логланщики есть. Логлано-английский и англо-логланский словарь можно сделать?
(Информацию и софт см. по адресу www.loglan.org.

fAX · Сообщение **fAX** » Пн май 16, 2005 03:51

maslovsky писал(а):
fAX писал(а):словарь Ожегова (2479 кб)
Большой энциклопедический словарь (13321 кб)

У меня нет постоянного хостинга, поэтому выкладываю на webfile. Поэтому все, кому нужны эти словари, пожалуйста, заберите их поскорее.

В выходные почитаю, как делать .ipk и постараюсь выложить также и в этом формате, чтобы можно было в feed его положить.
Отлично! Обязательно добавлю словари в feed.

Скачать словари в течение около 2-х недель можно с http://physics-regelman.com/fax/

Я положил там словарь Ожегова, Ожегова-Шведовой и Большой энциклопедический (исправленный). Все словари доступны как сами по себе, так и в виде .ipk (сколько я возился с последним форматом! мамочки! ну кто же знал, что он хочет ./control.tar.gz в архиве, а просто control.tar.gz - "не катит"... Ну да ладно...).

DMych · Сообщение **DMych** » Пн май 16, 2005 13:52

Владимир П. писал(а): Логланщики есть. Логлано-английский и англо-логланский словарь можно сделать?
(Информацию и софт см. по адресу www.loglan.org.

Пока не разберусь с остальными словарями, ничего другого делать не буду. Сорри.

Кстати, если кто знает: ограничение в 16К на статью - на что оно влияет? Я тут изменил в исходниках xerox это значение (добавил нолик справа) и пока ни на десктопе (qbedic), ни на завре (0.9.5) ничего подозрительного не заметил. В словаре Даля, который я сейчас колупаю, есть статейки поболее 16К объемом - все чудненько открывается и читается.

HPC.ru

Правильные словари для ZBedic

Re: "Кушать подано! Идите жрать, пожалуйста!" ;)

Куда положить?

Re: Куда положить?

ссылки

Re: ссылки

Словари языка Эсперанто

Re: ссылки

Re: Словари языка Эсперанто

Выложил словари

Re: Словари языка Эсперанто