Discussion:
Liczenie słów w LaTeX
(Wiadomość utworzona zbyt dawno temu. Odpowiedź niemożliwa.)
Uzytkownik
19 lat temu
Permalink
Mam plik LaTeX. Czy są jakieś programy analogiczne do statystyki wyrazów?
Tzn:
$ latex-count moj\ plik\ latex.tex
Words (with footnotes): 123
Words (without footnotes): 120
...

wc niestety nie rozróznia przypisów, a \begin{document} to też słowo ;)

Pozdrawiam
--
I've probably left my head... somewhere. Please wait untill I find it.
Homepage (pl_PL): http://uzytkownik.jogger.pl/
(GNU/)Linux User: #425935 (see http://counter.li.org/)
w***@gmail.com
19 lat temu
Permalink
Post by Uzytkownik
wc niestety nie rozróznia przypisów, a \begin{document} to też słowo ;)
Nie znam leteksa, ale czy sed -e s/\\.*//g' i policzenie słów
dowolnym programem nie załatwi sprawy?
Ogólnie sed usunie wszystkie "słowa" zaczynajace się od "\".
w***@gmail.com
19 lat temu
Permalink
Poprawka
Powinno być sed -e 's/ \\[a-zA-Z]*/ /g'
Uzytkownik
19 lat temu
Permalink
Post by w***@gmail.com
Post by Uzytkownik
wc niestety nie rozróznia przypisów, a \begin{document} to też słowo ;)
Nie znam leteksa, ale czy sed -e s/\\.*//g' i policzenie słów
dowolnym programem nie załatwi sprawy?
Ogólnie sed usunie wszystkie "słowa" zaczynajace się od "\".
Footnote?
Nie mówiąc już o komentarzach.
\underline{ważne}

Choć pomysł ze skryptem (bardziej rozbudowanym) jest niezły.
--
I've probably left my head... somewhere. Please wait untill I find it.
Homepage (pl_PL): http://uzytkownik.jogger.pl/
(GNU/)Linux User: #425935 (see http://counter.li.org/)
w***@gmail.com
19 lat temu
Permalink
Post by Uzytkownik
Post by w***@gmail.com
Post by Uzytkownik
wc niestety nie rozróznia przypisów, a \begin{document} to też słowo ;)
Nie znam leteksa, ale czy sed -e s/\\.*//g' i policzenie słów
dowolnym programem nie załatwi sprawy?
Ogólnie sed usunie wszystkie "słowa" zaczynajace się od "\".
Footnote?
Nie mówiąc już o komentarzach.
\underline{ważne}
Nie wiem do końca o co chodzi, bo sam latexa nie używam. zdawało mi
się, że wszystkie operatory zaczynaja sie od "\" a wszystkie takie
słowa ten skrypt usunie (cjodzi o póxniejszą poprawiona wersje).
Nie poradzi sobie jeszcze ze znakami "{} i "}" więc trzeba tak:

Powinno być sed -e 's/ \\[a-zA-Z{}]*/ /g'

jak trzeba jeszcze jakieś znaki obługiwać to tez tam je wystarczy
dodac(pewnie jeszcze przynajmniej cyfry).
Post by Uzytkownik
Choć pomysł ze skryptem (bardziej rozbudowanym) jest niezły.
To myle się, że wszystko co nie jest słowem w latexie zaczyna sie od
"\"?
Post by Uzytkownik
--
I've probably left my head... somewhere. Please wait untill I find it.
Homepage (pl_PL): http://uzytkownik.jogger.pl/
(GNU/)Linux User: #425935 (see http://counter.li.org/)
Uzytkownik
19 lat temu
Permalink
...
Zgadza się, ale chodzi o to, że pierwsze słowo np. w
podkreśleniu/wyróżnieniu będzie wyrzucone.
Post by w***@gmail.com
Post by Uzytkownik
Choć pomysł ze skryptem (bardziej rozbudowanym) jest niezły.
To myle się, że wszystko co nie jest słowem w latexie zaczyna sie od
"\"?
1. Chyba mogą być wstawki w TeX'u :), ale nimi się nie zajmuje
2. Trzeba by było trochę głębiej wejść w składnie, bo zawartość niektórych
operatorów może być istotna.


Pozdrawiam
--
I've probably left my head... somewhere. Please wait untill I find it.
Homepage (pl_PL): http://uzytkownik.jogger.pl/
(GNU/)Linux User: #425935 (see http://counter.li.org/)
w***@gmail.com
19 lat temu
Permalink
Post by Uzytkownik
2. Trzeba by było trochę głębiej wejść w składnie, bo zawartość niektórych
operatorów może być istotna.
Więc puśc plik na coś takiego:
sed -e 's/ \\[a-zA-Z{}]*/ /g' | grep -E ' \\'

wtedy zobaczysz tylko linie z operatorami których sed nie wycioł.
wtedy wystarczy popatrzeć jakich znaków tu nie uwzględniłem.

A tak na marginesie nie można przekonwertowac tego do jakiegoś
bardziej życiowego formatu, a potem zapisać jako zwykły plik
tekstowy?
Adam Becmer
19 lat temu
Permalink
Post by w***@gmail.com
Post by Uzytkownik
2. Trzeba by było trochę głębiej wejść w składnie, bo zawartość niektórych
operatorów może być istotna.
sed -e 's/ \\[a-zA-Z{}]*/ /g' | grep -E ' \\'
Zupełnie nie o to chodzi. Niektóre operatory zawierają już słowo, które
musi być zliczone - jest normalnym słowem tekstu, otrzymującym poprzez
operator specjalną cechę. Np. \underline{text} wydrukuje podkreślony napis
(_text_).
--
bec
Mikolaj Machowski
19 lat temu
Permalink
Post by Adam Becmer
Zupełnie nie o to chodzi. Niektóre operatory zawierają już słowo, które
musi być zliczone - jest normalnym słowem tekstu, otrzymującym poprzez
operator specjalną cechę. Np. \underline{text} wydrukuje podkreślony napis
(_text_).
Najpewniejszym rozwiązaniem jest wyprodukować pdf a potem pdf2txt... Ale
w ten sposób nie pozbędziesz się przypisów (chyba żeby w locie
przedefiniować polecenie \footnote by nic nie robiło).

m.
--
LaTeX + Vim = http://vim-latex.sourceforge.net/
Vim Universal Templates: http://vim.sf.net/script.php?script_id=1078
vim.pl - http://skawina.eu.org/mikolaj
CLEWN - http://clewn.sf.net
Grzegorz McCartney Olędzki
19 lat temu
Permalink
Post by Uzytkownik
Mam plik LaTeX. Czy są jakieś programy analogiczne do statystyki wyrazów?
$ latex-count moj\ plik\ latex.tex
Może na pl.comp.dtp.tex będą wiedzieli?

GO
Loading...