Home
dp_maxime
20 December 2009 @ 03:38 pm

Еще более быстрый вариант функции memcpy а-ля Duff’s device и используя конвеер (предыдущий вариант). Результаты сравнения времени выполнения теста, сравнивающего новый и старый варианты и стандартную библиотечную реализацию на невыровненных данных:

test0: FreeBSD memcpy in C 2.7686
test1: <new dps_memcpy>    0.43485
test2: <old dps_memcpy>    2.50218
test3: <standard memcpy>   0.456584
ratio(1/2): 0.17
ratio(1/0): 0.16
ratio(2/0): 0.90
ratio(1/3): 0.95

Читать запись полностью »

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
09 December 2009 @ 01:59 pm

Еще более быстрый вариант функции strncpy а-ля Duff’s device (предыдущий вариант). Результаты сравнения времени выполнения теста, сравнивающего новый и старый вариант ы и стандартную библиотечную реализацию:

test1: <new dps_strncpy>  3.00593
test2: <old dps_strncpy>  3.39416
test3: <standard strncpy> 5.06081
ratio(1/2): 0.89
ratio(1/3): 0.59
ratio(2/3): 0.67

Читать запись полностью »

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
29 October 2009 @ 09:39 pm

В продолжение пузырьков, кэшей и предсказателей переходов вариант пузырьковой сортировки а-ля Duff’s device:

Читать запись полностью »

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
07 June 2009 @ 11:43 pm

Google выпустил тулзу для веб-мастеров Page Speed, аналогичную YSlow от Yahoo (точнее разработчик, точнее один из, но руководитель группы, Стив Саудерс (Steve Souders) теперь работает в Google).

Page Speed реализована в виде плагина к Файрфоксу. Дает гораздо больше советов, чем YSlow, по оптимизации веб-страницы, которая анализируется. Рекомендуется веб-мастерам, даже если они больше любят Яндекс - вряд ли стоит ждать от него аналогичного инструмента в ближайшее время.

Кстати, если вы выбираете веб-дизайнерскую компанию, которая построит вам сайт (или переделает существующий), возможно этот плагин поможет вам оценить качество сайтов из портфолио различных веб-студий — чем меньше рекомендаций будет давать Page Speed, тем качественнее выполнены анализируемые сайты.

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
25 February 2009 @ 04:16 pm

Труды TREC 2008 выложили в открытый доступ.

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime

Дополнения к словарю русского языка для ispell от Александра Лебедева:

Читать запись полностью »

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
03 August 2008 @ 11:16 pm

Google Sets — один из проектов Google Labs, который по нескольким примерам, вводимым пользователем пробует строить множества (маленькое и большое) аналогичных элементов. Например, для набора из Сочи, Адлер, Хоста выводится список курортов, в основном на Чёрном море.

Как это работает ? Судя по всему при разборе индексируемых документов, Google смотрит на списки, организованные при помощи HTML-тэгов UL, OL, DL, H1..H6; размещенные в одном столбце или строке таблицы; элементы, перечисленные с разделением запятыми, точками с запятой или табуляцией; возможно каким-то другим способом. При этом собирается статистика, какое слово с какими другими словами чаще всего попадает в подобные списки.

Для чего это нужно ? В первую очередь для классификации незнакомых слов. Ну и само-собой эта статистика возможно используется в системе контекстной рекламы Google Adwords для подбора релеватной рекламы (в первую очередь в результатах поиска).

//SEO by the SEA

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
29 June 2008 @ 12:14 am

Google I/O sessions. В частности Underneath the Covers at Google: Current Systems and Future Directions.

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут

 
 
dp_maxime
23 October 2007 @ 04:38 pm

В закрытом загончике обсуждают работу сотрудников Яндекса, выполненную в рамках РОМИП:

Это ключевая публикация Яндекса в этом году. Можно считать, что Яндекс владеет технологией подавления заимствованного контента, т.е. сформированы предпосылки приоритета контента в поисковом продвижении.

Слишком высокие эпитеты для обычной обзорной статьи. Да, предложены новые методы, но, как отмечено немного ранее и в другом месте, эти алгоритмы решают только одну часть проблемы: когда один и тот же документ (с возможно небольшими модификациями) отдаётся по разным URL. Для случая злостного спамера, специально значительно коверкающего копируемые тексты, эти алгоритмы не работают, или работают много хуже.

Второй аспект: ну определит Яндекс, что два документа с разных серверов являются дублями друг друга, а дальше что ? У него же нет достоверного способа узнать первоисточник (кто автор), — просто в технологиях HTTP и HTML (да собственно ни в каком более-менее широко используемом протоколе или формате файла) не предусмотрено гарантированного и подтверждаемого третьей стороной указания даты публикации. Принимать решение в такой ситуации все равно, что бросать монетку.

Запись опубликована СоНоты.Вы можете оставить комментарии здесь или тут